[go: up one dir, main page]

WO2007017361A1 - Verfahren und sprachdialogsystem zur ermittlung zumindest einer transaktion zur bedienung einer hintergrundapplikation - Google Patents

Verfahren und sprachdialogsystem zur ermittlung zumindest einer transaktion zur bedienung einer hintergrundapplikation Download PDF

Info

Publication number
WO2007017361A1
WO2007017361A1 PCT/EP2006/064501 EP2006064501W WO2007017361A1 WO 2007017361 A1 WO2007017361 A1 WO 2007017361A1 EP 2006064501 W EP2006064501 W EP 2006064501W WO 2007017361 A1 WO2007017361 A1 WO 2007017361A1
Authority
WO
WIPO (PCT)
Prior art keywords
transaction
user
context information
transactions
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/EP2006/064501
Other languages
English (en)
French (fr)
Inventor
Dongyi Song
Hans-Ulrich Block
Rudolf Caspari
Jürgen Totzke
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Siemens Corp
Original Assignee
Siemens AG
Siemens Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG, Siemens Corp filed Critical Siemens AG
Publication of WO2007017361A1 publication Critical patent/WO2007017361A1/de
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning

Definitions

  • the invention relates to a method and an associated speech dialogue system for determining at least one transaction for operating a background application by evaluating contained in a user statement action information in such a speech dialogue system, each of a background application is associated with a finite set of selectable transactions and in which provided for in the speech dialogue system Input unit at least one user utterance recorded and stored in the speech dialogue system.
  • Speech dialog systems for database access which permit information access and control of communication applications via voice communication, are known as interfaces to many computer-aided applications.
  • Applications or background applications e.g. A technical device for consumer electronics, a telephone information system (train, flight, cinema, etc.), a computer-aided transaction system (home banking system, electronic goods ordering, etc.) are increasingly being used as access systems ("user interfaces") via such speech dialogue systems.
  • Such speech dialogue systems may be implemented in hardware, software or a combination thereof.
  • Dialogue progression to achieve application-specific dialogue goals is controlled via such a speech dialogue system, which manages the interactions between a dialogue management unit and the individual user.
  • the dialogue management unit has an input unit and output unit.
  • a user-generated user utterance for example in the form of a voice signal, is detected by the input unit and stored in the dialog management unit.
  • the input unit may for example be followed by a speech recognition unit, via which a determination of action information contained in a user statement is performed.
  • the output unit can be designed as a speech synthesis unit.
  • action information is obtained from the speech signal, for example in the form of individual words or word strings, which are evaluated by comparison with key words or grammars loaded in a parser.
  • a transaction associated with one or more key terms is started to handle background information.
  • a dialogue history with the respective user is created via the dialog management unit
  • voice recognition modules In order for a user to be able to place his requests in spoken natural language, the use of voice recognition modules or units is required.
  • Such language Detection modules are known, for example, from DE 197 19 381 C1 and DE 199 56 747 C1.
  • a background application is considered to be a finite set of transactions (T1, T2, .... Tx), where each transaction is associated with a finite set (which may also be empty) of transaction parameters (Pl, P2, Px).
  • the transaction parameters are known to the speech dialogue system.
  • a grammar is provided which serves to capture the transaction parameter in the dialog.
  • DE 101 10 977 C1 discloses a method and an arrangement for providing help information for a user of a speech dialogue system for operating a background application, in which predetermined help information is determined and output to the user depending on the current dialog status. The user is thus provided with context-sensitive help information by the speech dialogue system, depending on his respective dialog status.
  • unified messaging systems are known, by means of which various messages are stored on a communication platform, managed and accessed via different types of access, for example emails, SMS or even classic telephone, fax and answering machine functions be linked, so that for example via such a "Unified Messaging System” a fax, an e-mail or email an SMS message can be sent to a mobile phone. Answering machine messages can be monitored as usual or texts and emails can be read out using the "Text-to-Speech" (TTS) procedure.
  • TTS Text-to-Speech
  • the object of the present invention is thus to provide a method for determining at least one transaction for operating a background application and an associated speech dialogue system, in which a clear identification of the desired user application background fast and user-friendly, in particular already on the basis of reduced action information possible becomes.
  • the object is achieved by a method according to claim 1 and a speech dialogue system according to claim 16.
  • the essential idea of the method according to the invention for determining at least one transaction for operating a background application and evaluation of at least one action information contained in a user statement in a speech dialogue system, in each of which a background application is assigned a finite set of selectable transactions and in which via an input unit provided in the speech dialogue system at least one user statement is recorded and stored in the speech dialogue system, is that each in the context of transactions in the speech dialogue system is assigned at least one matching context information and the context information of at least the last executed transaction is stored in the speech dialogue system.
  • those transactions whose associated context information corresponds with the stored context information are advantageously preferably taken into account.
  • FIG. 1 shows a schematic block diagram of a speech dialogue system by way of example
  • FIG. 2 shows by way of example the individual components of a transaction in a further block diagram
  • FIG. 3 shows by way of example the individual steps of the method according to the invention in a flowchart.
  • Fig. 1 is a schematic block diagram exemplified a voice dialogue system 1, via which a user B can operate at least one background application HA.
  • the operation of the background application HA takes place here by way of example on the basis of individual selected and stored in the speech dialogue system 1 transactions Tl to Tx, which are assigned to one or more functions of the background application HA.
  • the speech dialogue system 1 illustrated in FIG. 1 comprises an input unit 2, a dialog management unit 3 and an output unit 4, the dialog management unit 3 being in each case in communication with the input unit 2, the output unit 4 and the background application HA.
  • a memory unit 5 for storing the transactions Tl to Tx for operating the background application HA and other parameters is provided.
  • the dialogue management unit 3 also has a
  • Speech recognition unit 6, a speech synthesis unit 7, a parser unit 8 and a control unit 9 which, for example, connected to each other via a data bus DBS system are.
  • the background application HA which in an alternative embodiment can be connected to the dialogue management unit 3 via an interface module (not shown in FIG. 1), is likewise connected to the data bus system DBS.
  • the input unit 2 of the speech dialogue system 1 is connected to the speech recognition unit 6 and the output unit 4 to the speech synthesis unit 7.
  • a user statement BE is generated, which has action information AI. This can be a
  • User statement BE have one or more action information AI, which can be arranged within the user statement BE in different orders.
  • a user statement BE of the user B preferably detected as a voice signal and stored in the dialogue management unit 3.
  • the user utterance BE is digitized or supplied in digital form to the storage unit 5 and the action information (s) AI contained in the user statement BE is determined via the speech recognition unit 6 in a manner known per se and stored in the storage unit 5.
  • the output unit 4 can provide the user B with output prompts or information prompts AP, which are output via the output unit 4, for example in the form of a synthesized speech signal generated by the speech synthesis unit 7.
  • the user B is informed, for example, about the current status of the background application HA to be operated or the actions carried out by the system on the basis of the last user statement BE, or the user B initiates the delivery of at least one further user statement BE.
  • a clarification dialog which alternates between output prompt AP and user statements BE can be carried out.
  • FIG. 2 is a schematic representation of the individual components of such a transaction T 1 to T x, which are used to operate the different lent functions of the background application HA are provided in the dialogue management unit 3.
  • a background application HA is assigned a finite set of such transactions Tl-Tx whose selection is triggered via a respective grammatical routine GR assigned to a respective transaction Tl-Tx.
  • one or more such grammars G1-Gx are assigned to the transaction T1, which are loaded into the parser unit 8 for determining the transactions T1 to Tx belonging to the stored action information AI.
  • the parser unit 8 the individual key terms of the grammars G1-Gx characterizing the respective transaction T1 are compared with the action information AI.
  • the grammars G1-Gx can be replaced or extended, for example, by contextual grammars G1 * - Gx * which, taking into account the
  • the first transaction T 1 shown by way of example in FIG. 2 has a preconditioning routine VBR, which is executed before the further execution of a transaction T 1 -Tx in the control unit 9 in order to verify the existence of preconditions such as, for example, the successful execution of another transaction T 2.
  • the preconditioning routine VBR has one or more precondition parameters VBP and associated parameter prompts PP.
  • the preconditioning routine VBR executed in the control unit 9 checks, for example, the activation or deactivation of a further transaction T2 and, depending on the result, selects the associated parameter prompt PP and outputs it to the user B via the speech synthesis unit 7 and the output unit 4.
  • the mutually correlated context information KI is assigned to the transactions T1-Tx in the speech dialogue system 1, and thus the transactions T2, T3 having a meaningful relationship are combined into a respective transaction group TG1-TGx with matching context information KI.
  • a second and third transaction T2, T3 are combined to form a first transaction group TG1.
  • the context-related link KI interlinks different transactions Tl-Tx evaluated for the current determination of a transaction Tl to Tx, thereby significantly reducing the time and computational effort for the conduct of the investigation.
  • the context information Klo t z t is stored at least the last executed in the dialogue management unit 3 transaction T iet z t and taken into account in the current determination of a transaction Tl - Tx, in such a way that preferably those transactions T2 , T3 are considered in the determination whose associated context information KI matches the stored context information Klo t z t .
  • the current transaction Tl - Tx first of all that transaction group TG1 - TGx is considered to which the last executed transaction Tietzt belongs.
  • the transactions Tl-Tx of the determined transaction group TG1-TGx are particularly advantageously prioritized in the selection process, and thus those Transactions Tl - Tx executed having the largest "hit probability".
  • context information KI transaction Tl - Tx each associated with a context information routine KIR that t the conformity of the transaction Tl associated context information AI with the data stored in the storage unit 5.
  • context information toilet z t of the last executed in the dialog management unit 3 Transaction T iet z t checked. If the last stored context information Klo t z t and the context information KI associated with the first transaction Tl match, the considered first transaction Tl is preferably taken into account in the determination of the current transaction, ie the action information AI obtained from the user statement BE in the parser unit 8 executed grammar routine GR of the considered transaction Tl evaluated.
  • the context information KI may, for example, have the parameter type "string", which represents a preamble representing the meaning context between the transactions Tl to Tx.
  • each transaction Tl-Tx is assigned a transaction parameter routine TPR which, in addition to the determined transaction parameters P1-Px, has transaction parameter prompts TPP, a parameter grammar PGR and a value determination information WEI.
  • the transaction Tl is specified content by its transaction parameters Pl - Px whose values are determined via the transaction parameter routine TPR.
  • the values of the transaction parameters Pl-Pix are determined from the action information AI via the parameter grammar PGR executed in parser unit 8.
  • the transaction parameters Pl - Px still to be determined for the execution of the transaction Tl - Tx are queried by issuing the respectively assigned transaction parameter prompt TPP to the user B and his action information AI contained in another user statement BE in the context of a clarification dialog.
  • value determination information WEI assigned in each case to the individual transaction parameters Pl - Px is determined in which manner the determination of the transaction parameters P1 - Px should or can take place. For example, to determine the transaction parameters Pl - Px in addition to the
  • a constraint routine CR per transaction Tl-Tx which includes trigger parameters TR, logical conditions LB and action instruction prompts AA.
  • the modified parameter value of a transaction parameter P 1 -Px is thus ascertained for validity via the contraint routine CR with the aid of the predetermined trigger parameters TR and the logical condition LB and communicated to the user B in the event of a deviation via action instruction prompts AA.
  • a logical condition LB it is predetermined as a logical condition LB to form the sum of two transaction parameters P 1 , P 2 and to check whether this, for example, exceeds an upper limit P max .
  • the upper limit P max is exceeded, the associated action instruction prompt AA becomes the
  • Contraint routine CR issued.
  • a predetermined system function can also be initiated.
  • a Nachbedingungsroutine NBR is checked whether all necessary for the execution of the respective transaction Tl - Tx post-conditions NB, for example, at least the required transaction parameter Pl - Px, now present, ie the gaps of the frame-modeled transaction Tl are filled and using the selected transaction Tl the associated function of the background application HA can now be started.
  • the Nachbedingungsroutine NBR those post-conditions NB are checked, which must be present at the end of the dialog to ensure a transfer of all necessary for the operation of the background application HA information about the transaction Tl.
  • the post-conditional routine NBR can be used to individually define and check different complex post-conditions NB for different transactions Tl-Tx.
  • a transaction Tl-Tx has a system operation routine SAR, with the aid of which the output of specific action prompts AP or system actions SA is implemented.
  • the system action routine SAR comprises, for example, system trigger parameters TRP and precondition information VBI as well as predetermined system actions SA.
  • system trigger parameter TRP changes, the initiation of the predetermined system actions SA is verified via the precondition information VBI and, if appropriate, the assigned system actions SA are started.
  • the user B is thus informed about a change in the dialog status or the status of the background application HA.
  • FIG. 3 shows by way of example the method according to the invention for determining at least one transaction Tl -Tx in the speech dialogue system 1 in a flow chart.
  • a selection routine AR executed in the control unit 9
  • the five method steps S1-S5 shown in FIG. 3 are executed.
  • the correlated context information KI is assigned to the transactions Tl-Tx that are in a context of meaning.
  • the context information KI associated therewith is used as last stock response associated context information i m Pushdia- logssystem 1 and the memory unit 5 of the dialogue management unit 3 stored (second step S2).
  • the previously determined transactions T2, T3 are preferably used for determining the current transaction Tl-Tx from the finite quantity of the transactions Tl-Tx.
  • a "unified messaging system" is considered by way of example, which as a rule consists of a telephone connection between the user B and the speech dialogue system 1, ie the input unit 2 is designed as a microphone unit of a telephone and the output unit 4 as a loudspeaker unit thereof
  • Basic functions of such a Unified Messaging system can be called the following functions:
  • the action information AI obtained from the user statement BE is compared with the grammars G1-Gx or their key terms required for executing the first transaction T1, and the associated transaction T1 is started if the match is correct.
  • the user B inputs his telephone number and the associated password in the voice dialogue system 1 as a user statement BE.
  • the user utterance BE is detected via the input unit 2 and, based on the speech recognition unit 6, the telephone number contained in the user utterance BE and the password determined and stored as action information AI in the memory unit 5.
  • the Nachbedingungsroutine NBR is the existence of the for the execution of the first transaction Tl "user identification" assigned function of the background application
  • an action prompt AP indicating the status of the identification process is output to the user B via the output unit 4.
  • a context information KI associated with the first transaction Tl is optionally stored in the memory unit 5.
  • the user B enters the following user statement BE in the speech dialogue system 1: "I want to listen to my new messages.”
  • the user utterance BE is recorded via the input unit 2 and the action information AI included in the user utterance BE using the speech recognition unit 6 determined and stored in the memory unit 5.
  • Possible action information AI can here be the terms “new”, “messages” and “listening”.
  • the context information routine KIR firstly compares the context information KI associated with each transaction Tl-Tx with the last stored context information Klo t z t , and preferably uses this transaction T2, T3 to determine the current transaction T2.
  • the last stored context information Klo t z t can be loaded and after querying the context information KI of the individual transactions Tl-Tx those transactions T2, T3 with matching context information KI for the determination of the current transaction T2, T3 be provided.
  • the respective grammar routine GR is considered to be meaningful, i.
  • the transactions T2, T3 having the same context information KI are started, and the agreement of the action information AI obtained from the user statement BE with the grammars G1 - Gx required for executing the second or third transaction T2, T3 and their keywords is checked and, if they match, the determined transaction T2 started.
  • the second transaction T2 is "query new
  • Unified Messaging System message query "assigned, which in turn executes the second transaction T2 in the memory storage unit 5 of the dialogue management unit 3 is stored as last assigned context information Klo t z t .
  • the function ("polling new messages") of the background application HA "Unified Messaging System" assigned to the second transaction T2 is subsequently called, and the associated information prompt AP together with the messages to the user B via the output unit 4 issued.
  • the dialogue structure on which the second transaction T2 is based can thus be illustrated as an example as follows:
  • the submitted user statement BE "I would like to listen to the new messages from Mr. Maier" is in turn detected via the input unit 2 and the voice information unit 6 determines the action information AI contained in the user statement BE, which is stored in the memory unit 5.
  • the dialog Management unit 3 is stored after the execution of the second transaction T2 as the last stored context information Klo t z t "unified messaging system: message query".
  • the respective grammar routine GR of the third transaction T3 is started and the correspondence of the action information AI obtained from the user statement BE with the grammars G1 - Gx required for executing the third transaction T3 or their key terms is checked and, if they match, the third transaction T3 continue running.
  • transaction parameter Pl "name" the name of the person ("Mr. Maier ") whose new messages are to be output to user B.
  • the context information KI" Unified Messaging System message query "in the memory unit 5 as the last present context information loo t z t stored.
  • the fourth transaction T4 is provided.
  • the grammar routine GR of the fourth transaction T4 is started and the correspondence of the action information AI obtained from the user request BE with the grammars G1 - Gx required for executing the fourth transaction T4 or their key terms is checked and, on the basis of their agreement with the stored transaction information, the fourth transaction T4 further executed.
  • the user BE In order to send a message to the given recipient "Mr Maier", it is first necessary for the user BE to enter the message into the speech dialogue system 1.
  • the value of the fourth transaction parameter P4 "receiver", namely the receiver of the recorded message, is determined by means of the transaction parameter routine TPR.
  • transmission parameters regarding the recorded message can also be queried by user B as further transaction parameters P6-Px ("Special Settings"), for example the confidentiality, urgency, encryption, etc., by means of a further clarification dialog.
  • the context information KI "Unified Messaging System: Messaging” is also stored in the memory unit 5 as last-available context information Klo t z t via the context information routine KIR.
  • the associated function (“send message") is called within the Unified Messaging system and the associated information Prompt AP generated and output via the output unit 4.
  • BEI 123456 System (AP2): Phone number 123456, please enter your password.
  • BE2 333666 System AP3: You are logged into the system. What can I do for you?
  • KIR context information routine LB logical condition parameters NBA postcondition actions NBP postcondition parameters NBR postcondition routine

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

Unter Auswertung von zumindest einer in einer Benutzeräußerung enthaltenen Aktionsinformation wird in einem Sprachdialogsystem zur Ermittlung zumindest einer aktuellen Transaktion in einem Sinnzusammenhang stehenden Transaktionen im Sprachdialogsystem jeweils zumindest eine übereinstimmende Kontextinformation zugeordnet . Die Kontextinformation zumindest der zuletzt ausgeführten Transaktion wird im Sprashdialogsystem gespeichert und bei der Ermittlung der aktuellen Transaktion werden bevorzugt diejenigen Transaktionen berücksichtigt, deren zugeordnete Kontextinformation mit der gespeicherten Kontextinformation übereinstimmt.

Description

Beschreibung
Verfahren und Sprachdialogsystem zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation
Die Erfindung betrifft ein Verfahren sowie ein zugehöriges Sprachdialogsystem zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation unter Auswertung von in einer Benutzeräußerung enthaltenen Aktionsinformationen in einem derartigen Sprachdialogsystem, wobei jeweils einer Hintergrundapplikation eine endliche Menge auswählbarer Transaktionen zugeordnet ist und bei dem über eine im Sprachdialogsystem vorgesehene Eingabeeinheit zumindest eine Benut- zeräußerung erfasst und im Sprachdialogsystem gespeichert wird.
Sprachdialogsysteme für Datenbankzugriffe, welche Informationszugriffe sowie eine Steuerung von Kommunikationsapplikati- onen via Sprachkommunikation ermöglichen, sind als Schnittstellen zu vielen computergestützten Anwendungen bekannt. Anwendungen bzw. Hintergrundapplikationen, wie z.B. ein technisches Gerät der Unterhaltungselektronik, ein telefonisches Auskunftsystem (Bahn, Flug, Kino, etc.), ein computergestütz- tes Transaktionssystem (Homebanking-System, elektronische Warenbestellung etc.) sind in zunehmendem Maße über derartige Sprachdialogsysteme als Zugangssysteme („User-Interfaces") bedienbar. Derartige Sprachdialogsysteme können in Hardware, Software oder in einer Kombination daraus realisiert werden.
Der Dialogverlauf zur Erreichung von anwendungspezifischen Dialogzielen wird über ein derartiges Sprachdialogsystem gesteuert, welches die Interaktionen zwischen einer Dialog- Management-Einheit und dem einzelnen Benutzer verwaltet. Hierzu weist die Dialog-Management-Einheit eine Eingabeeinheit sowie Ausgabeeinheit auf. Eine von einem Benutzer erzeugte Benutzeräußerung beispielsweise in Form eines Sprachsignals wird durch die Eingabeeinheit erfasst und in der Dialog-Management-Einheit gespeichert. Der Eingabeeinheit kann beispielsweise eine Spracher- kennungseinheit nachgeschaltet sein, über welche eine Ermittlung von in einer Benutzeräußerung enthaltenen Aktionsinformationen durchgeführt wird. Zur Ausgabe von Aktionsprompts in Form von Sprachsignalen kann die Ausgabeeinheit als Sprachsyntheseeinheit ausgebildet sein.
Über die in der Dialog-Management-Einheit vorgesehene Sprach- erkennungseinheit werden aus dem Sprachsignal Aktionsinformationen beispielsweise in Form von einzelnen Wörtern oder Wörterketten gewonnen, welche durch Vergleich mit in einer Par- sereinheit geladenen Schlüsselbegriffen bzw. Grammatiken ausgewertet werden. Abhängig von dem Auswerteergebnis wird eine einem oder mehreren Schlüsselbegriffen zugeordnete Transaktion zur Bedienung einer Hintergrundinformation gestartet. Abhängig von den Transaktionen wird über die Dialog-Management- Einheit ein Dialogverlauf mit dem jeweiligen Benutzer zur
Steuerung der zugehörigen Hintergrundapplikation aufgenommen.
Derzeit sind drei Ansätze zur Realisierung von derartigen Sprachdialogsystemen bekannt, nämlich der „Finite-State- Based" Ansatz, der „Frame-Based" Ansatz und der „Agent-Based" Ansatz. Der „Frame-Based" bzw. rahmenorientierte Ansatz findet derzeitig in der Praxis die weiteste Verbreitung. Da der Dialogverlauf von rahmenorientierten Sprachdialogsystemen nicht an einer hierarchischen Baumstruktur organisiert ist, ermöglichen dieser eine große Flexibilität. Vielmehr ist jede Transaktion anhand eines Rahmens modelliert, welcher mehrere Lücken aufweist, die durch die Zuordnung von Transaktionsparameter gefüllt werden.
Damit ein Benutzer seine Anfragen in gesprochener natürlicher Sprache stellen kann, ist die Verwendung von Spracherken- nungsmodulen bzw. -einheiten erforderlich. Derartige Sprach- erkennungsmodule sind beispielsweise aus der DE 197 19 381 Cl und der DE 199 56 747 Cl bekannt.
Ferner ist bereits ein Verfahren zur Aktionsermittlung (DE 196 15 693 Cl) bekannt, bei dem ein Benutzer gezielte Befehle erteilt oder eine gezielte Anfrage an ein Sprachdialogsystem stellt, ohne dass ihm die zur Verfügung stehenden Auswahlalternativen langwierig aufgezählt werden. Hierdurch wird ein direkter Zugriff auf eine Vielzahl von Funktionen eines Sprachdialogsystems möglich, der lediglich einen Dialog erfordert, sofern die Anfangsäußerungen des Benutzers unvollständig oder mehrdeutig oder in Widerspruch zu einzelnen Möglichkeiten der Hintergrundapplikation stehen. In dem beschrieben Fällen greift das beschriebene Sprachdialogsystem mit der Bezeichnung DIANE ein und führt mit dem Benutzer einen Klärungsdialog durch, um die Benutzerintension zu ermitteln und fehlende Informationseinheiten zu erfragen. Dem beschriebenen Verfahren liegt das folgende abstrakte Aufgabenmodell zugrunde:
Eine Hintergrundapplikation wird als eine endliche Menge von Transaktionen (Tl, T2, .... Tx) aufgefasst, wobei jeder Transaktion eine endliche Menge (die auch leer sein kann) von Transaktionsparametern (Pl, P2, Px) zugeordnet sind. Die Transaktionsparameter sind dem Sprachdialogsystem bekannt. Zu jedem Transaktionsparameter ist eine Grammatik vorgesehen, die dazu dient, den Transaktionsparameter im Dialog zu erfassen.
Der Benutzer kann die gewünschte Transaktion und die zugeordneten Transaktionsparameter in einem Satz benennen oder auch nicht. Im ersten Fall kann die Transaktion sofort durchgeführt werden, im zweiten Fall werden die noch unbekannten Parameter im Dialog mit dem Benutzer erfasst. Falls durch die Benutzeräußerung keine Transaktion eindeutig bestimmbar ist, führt das System automatisch einen Klärungsdialog zur Ermittlung der gewünschten Transaktion durch. Gleiches gilt für unklare oder unvollständige Transaktionsparametereingaben. Aus der DE 101 10 977 Cl ist ein Verfahren und eine Anordnung zum Bereitstellen von Hilfe-Informationen für einen Benutzer eines Sprachdialogssystems zum Bedienen einer Hintergrundap- plikation bekannt, bei dem abhängig von dem jeweils vorliegenden Dialogstatus vorgegebene Hilfeinformationen ermittelt und an den Benutzer ausgegeben werden. Dem Benutzer werden somit abhängig von seinem jeweiligen Dialogsstatus kontextsensitive Hilfe-Informationen durch das Sprachdialogssystem bereitgestellt.
Ferner sind „Unified Messaging Systeme" bekannt, durch welche verschiedene Nachrichten auf einer Kommunikationsplattform gespeichert, verwaltet sowie der Zugriff auf diese über un- terschiedliche Zugriffsarten ermöglicht wird. Beispielsweise können Emails, SMS oder auch klassische Telefon-, Fax- und Anrufbeantworter-Funktionen hierüber verknüpft werden, so dass beispielsweise über ein derartiges „Unified Messaging System" ein Fax, eine Email oder per Email eine SMS-Botschaft an ein Handy geschickt werden können. Anrufbeantworter- Nachrichten können wie gewohnt abgehört werden oder auch SMS und Emails mittels „Text-To-Speech" (TTS) -Verfahren vorgelesen werden. Über ein Sprachdialogsystem können somit die einzelnen Nachrichten von unterwegs abgehört, beantwortet, wei- tergeleitet oder gelöscht werden. Insbesondere bei einer derartigen Vielzahl von Funktionen der Hintergrundapplikation „Unified Messaging System" ist es für einen Benutzer oft sehr mühsam, sich von einer bestimmten Funktion zu einer anderen Funktion zu bewegen.
Damit derartige Sprachdialogsystem auf Dauer von einem breiten Benutzerkreis akzeptiert werden, ist neben einer sicheren Spracherkennung auch der Einsatz von Sprachdialogsystemen erforderlich, die den Benutzer nicht unnötige Zeit damit verbringen lassen, auf die richtige Frage des Sprachdialogsystems zu warten oder die richtige Frage durch etwaige Manipulationen zu erzwingen. Die Aufgabe der vorliegenden Erfindung besteht somit darin, ein Verfahren zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation sowie ein zugehöriges Sprachdialogsystem anzugeben, bei dem eine eindeutige Identi- fizierung der vom Benutzer gewünschten Hintergrundapplikation schnell und benutzerfreundlich, insbesondere auch bereits anhand von reduzierten Aktionsinformationen möglich wird. Die Aufgabe wird durch ein Verfahren gemäß Patentanspruch 1 sowie ein Sprachdialogsystem gemäß Patentanspruch 16 gelöst.
Der wesentliche Gedanke des erfindungsgemäßen Verfahrens zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation und Auswertung von zumindest einer in einer Benutzungsäußerung enthaltenen Aktionsinformation in einem Sprachdialogsystem, bei dem jeweils einer Hintergrundapplikation eine endliche Menge auswählbarer Transaktionen zugeordnet ist und bei dem über eine im Sprachdialogsystem vorgesehene Eingabeeinheit zumindest eine Benutzeräußerung erfasst und im Sprachdialogsystem gespeichert wird, besteht darin, dass einzelnen in einem Sinnzusammenhang stehenden Transaktionen im Sprachdialogsystem jeweils zumindest eine übereinstimmende Kontextinformation zugeordnet wird und die Kontextinformation zumindest der zuletzt ausgeführten Transaktion im Sprachdialogsystem gespeichert wird. Bei der Er- mittlung einer Transaktion werden vorteilhaft bevorzugt diejenigen Transaktionen berücksichtigt, deren zugeordnete Kontextinformation mit der gespeicherten Kontextinformation ü- bereinstimmt . Vorteilhaft werden durch die Zuordnung zumindest einer Kontextinformationen zu den in einem Sinnzusammen- hang stehenden Transaktionen bevorzugt diejenigen Transaktionen bei der Suche nach der aktuell durch den Benutzer durch die Benutzeräußerung angesprochene Transaktion berücksichtigt und hierdurch der sowohl zeitintensive als auch rechenintensive Ermittlungsaufwand deutlich reduziert. Weiterhin vor- teilhaft können anhand von kontextabhängigen Grammatiken bereits verkürzte Schlüsselbegriffe ausreichen, um die vom Benutzer gewünschte Aktion zu bestimmen. Weitere vorteilhafte Ausgestaltungen des erfindungsgemäßen Verfahrens, insbesondere ein Sprachdialogsystem zur Ausführung des Verfahrens sind den weiteren Ansprüchen zu entnehmen .
Die vorliegende Erfindung wird nachfolgend an einem Ausführungsbeispiel anhand von Figuren näher erläutert.
Es zeigen:
Fig. 1 in einem schematischen Blockschaltbild beispielhaft ein Sprachdialogsystem, Fig. 2 in einem weiteren Blockschaltbild beispielhaft die einzelnen Komponenten einer Transaktion und Fig. 3 in einem Ablaufdiagramm beispielhaft die einzelnen Schritte des erfindungsgemäßen Verfahren.
In Fig. 1 ist in einem schematischen Blockschaltbild beispielhaft ein Sprachdialogsystem 1 dargestellt, über welches ein Benutzer B zumindest eine Hintergrundapplikation HA bedienen kann. Die Bedienung der Hintergrundapplikation HA erfolgt hierbei beispielhaft anhand einzelner ausgewählter und im Sprachdialogsystem 1 hinterlegter Transaktionen Tl bis Tx, welche einer oder mehrerer Funktionen der Hintergrundapplika- tion HA zugeordnet sind. Das in Figur 1 dargestellte Sprachdialogsystem 1 umfasst hierzu eine Eingabeeinheit 2, eine Dialog-Management-Einheit 3 und eine Ausgabeeinheit 4, wobei die Dialog-Management-Einheit 3 jeweils mit der Eingabeeinheit 2, der Ausgabeeinheit 4 sowie der Hintergrundapplikation HA in Verbindung steht.
In der Dialog-Management-Einheit 3 ist eine Speichereinheit 5 zur Speicherung der Transaktionen Tl bis Tx zur Bedienung der Hintergrundapplikation HA sowie weiterer Parameter vorgese- hen. Die Dialog-Management-Einheit 3 weist ferner eine
Spracherkennungseinheit 6, eine Sprachsyntheseeinheit 7, eine Parsereinheit 8 sowie eine Steuereinheit 9 auf, welche beispielsweise über ein Datenbussystem DBS miteinander verbunden sind. An das DatenbusSystem DBS ist ebenfalls die Hintergrundapplikation HA angeschlossen, welche in einer alternativen Ausführungsform über ein Schnittstellenmodul (nicht in Figur 1 dargestellt) mit der Dialog-Management-Einheit 3 ver- bunden sein kann. Die Eingabeeinheit 2 des Sprachdialogsystems 1 ist mit der Spracherkennungseinheit 6 und die Ausgabeeinheit 4 mit der Sprachsyntheseeinheit 7 verbunden.
Durch den Benutzer B wird eine Benutzeräußerung BE erzeugt, welche Aktionsinformationen AI aufweist. Hierbei kann eine
Benutzeräußerung BE eine oder mehrere Aktionsinformationen AI aufweisen, welche innerhalb der Benutzeräußerung BE in unterschiedlichen Reihenfolgen angeordnet sein können. Über die Eingabeeinheit 2 wird eine Benutzeräußerung BE des Benutzers B, vorzugsweise als Sprachsignal erfasst und in der Dialog- Management-Einheit 3 abgespeichert. In einer bevorzugten Ausführungsform wird die Benutzeräußerung BE digitalisiert bzw. in digitaler Form der Speichereinheit 5 zugeführt und über die Spracherkennungseinheit 6 in an sich bekannter Weise die in der Benutzeräußerung BE enthaltenen Aktionsinformation (en) AI ermittelt sowie in der Speichereinheit 5 abgelegt.
Über die Ausgabeeinheit 4 können darüber hinaus dem Benutzer B Ausgabeprompts bzw. Informationsprompts AP zur Verfügung gestellt werden, welche beispielsweise in Form eines durch die Sprachsyntheseeinheit 7 erzeugtes synthetisiertes Sprachsignal über die Ausgabeeinheit 4 ausgegeben werden. Hierdurch wird der Benutzer B beispielsweise über den aktuellen Status der zu bedienenden Hintergrundapplikation HA bzw. der vom System aufgrund der letzten Benutzeräußerung BE durchgeführten Aktionen informiert oder der Benutzer B zur Abgabe zumindest einer weiteren Benutzeräußerungen BE veranlasst. Hierzu kann ein zwischen Ausgabeprompts AP und Benutzeräußerungen BE wechselnder Klärungsdialog durchgeführt werden.
In Figur 2 sind in einer schematischen Darstellung beispielhaft die einzelnen Komponenten einer derartiger Transaktion Tl bis Tx dargestellt, welche zur Bedienung der unterschied- liehen Funktionen der Hintergrundapplikation HA in der Dialog-Management-Einheit 3 vorgesehen sind. Einer Hintergrundapplikation HA ist eine endliche Menge derartiger Transaktionen Tl - Tx zugeordnet, deren Auswahl über eine jeweils einer Transaktion Tl - Tx zugeordneten Grammatikroutine GR getrig- gert wird. Hierbei werden der Transaktion Tl eine oder mehrere derartiger Grammatiken Gl - Gx zugeordnet, welche zur Ermittlung der zur gespeicherten Aktionsinformation AI zugehörigen Transaktion Tl bis Tx in die Parsereinheit 8 geladen werden. In der Parsereinheit 8 werden die einzelnen für die jeweilige Transaktion Tl charakterisierenden Schlüsselbegriffe der Grammatiken Gl - Gx mit den Aktionsinformationen AI verglichen. Hierbei können die Grammatiken Gl - Gx beispielhaft durch bzw. um kontextabhängige Grammatiken Gl* - Gx* er- setzt bzw. erweitert werden, die unter Berücksichtigung des
Sinnzusammenhangs zwischen den einzelnen Transaktionen Tl bis Tx verkürzte Schlüsselbegriffe aufweisen.
Ferner weist die in Figur 2 beispielhaft dargestellte erste Transaktion Tl eine Vorbedingungsroutine VBR auf, welche vor der weiteren Ausführung einer Transaktion Tl - Tx in der Steuereinheit 9 ausgeführt wird, um das Vorliegen von Vorbedingungen wie beispielsweise der erfolgreichen Ausführung einer weiteren Transaktion T2 zu verifizieren. Hierzu weist die Vorbedingungsroutine VBR einen oder mehrere Vorbedingungsparameter VBP sowie zugehörige Parameterprompts PP auf. Durch die in der Steuereinheit 9 ausgeführte Vorbedingungsroutine VBR wird beispielsweise die Aktivierung bzw. Deaktivierung einer weiteren Transaktion T2 überprüft und abhängig vom Er- gebnis der zugeordnete Parameterprompt PP ausgewählt und über die Sprachsyntheseeinheit 7 sowie die Ausgabeeinheit 4 an den Benutzer B ausgegeben. Ist die anhand der Vorbedingungsparameter VBP definierte Vorbedingung für die Ausführung der betrachteten ersten Transaktion Tl erfüllt, wird ohne eine Aus- gäbe eines Parameterprompts PP die weitere Ausführung der ermittelten ersten Transaktion Tl initiiert. Erfindungsgemäß wird den in einem Sinnzusammenhang stehenden Transaktionen Tl - Tx im Sprachdialogsystem 1 jeweils zumindest eine übereinstimmende Kontextinformation KI zugeordnet und somit die einen Sinnzusammenhang aufweisenden Transaktio- nen T2, T3 zu jeweils einer Transaktionsgruppe TGl - TGx mit übereinstimmender Kontextinformation KI zusammengefasst . In Figur 1 sind beispielhaft eine zweite und dritte Transaktion T2, T3 zu einer ersten Transaktionsgruppe TGl zusammenge- fasst .
Insbesondere eine Hintergrundapplikation HA wie beispielsweise ein „Unified Messaging System" mit einer Vielzahl von ähnlichen Funktionen betreffenden Transaktionen Tl - Tx, so dass viele der Transaktionen Tl - Tx derartige Übereinstimmungen aufweisen. Beispielsweise der ersten Transaktion Tl =,,Email lesen" und der zweiten Transaktion T2=„Email löschen" kann durch die Zuordnung der Kontextinformation KI =,,Email Verarbeitung" zu einer ersten Transaktionsgruppe TGl= „Email Verarbeitung" zusammengefasst werden. Somit wird durch die Kon- textinformation KI die kontextbedingte Verknüpfung unterschiedlicher Transaktionen Tl - Tx untereinander für die aktuelle Ermittlung einer Transaktion Tl bis Tx ausgewertet und hierdurch der Zeit- und Rechenaufwand für die Durchführung des Ermittlungsverfahrens deutlich reduziert.
In der Speichereinheit 5 wird die Kontextinformation Klotzt zumindest der zuletzt in der Dialog-Management-Einheit 3 ausgeführten Transaktion Tietzt gespeichert und bei der aktuellen Ermittlung einer Transaktion Tl - Tx berücksichtigt, und zwar derart, dass bevorzugt diejenigen Transaktionen T2,T3 bei der Ermittlung berücksichtigt werden, deren zugeordnete Kontextinformation KI mit der gespeicherten Kontextinformtion Klotzt übereinstimmt. Für die Ermittlung der aktuellen Transaktion Tl - Tx wird somit zunächst diejenige Transaktionengruppe TGl - TGx betrachtet, der die zuletzt ausgeführte Transaktion Tietzt angehört. Hierdurch werden besonders vorteilhaft die Transaktionen Tl - Tx der ermittelten Transaktionsgruppe TGl - TGx im Auswahlverfahren priorisiert und somit diejenigen Transaktionen Tl - Tx ausgeführt, die die größte „Trefferwahrscheinlichkeit" aufweisen.
Zur Überprüfung der Kontextinformation KI ist der Transaktion Tl - Tx jeweils eine Kontextinformationsroutine KIR zugeordnet, die die Übereinstimmung der der Transaktion Tl zugeordneten Kontextinformation KI mit der in der Speichereinheit 5 gespeicherten Kontextinformation Klotzt der zuletzt in der Dialog-Management-Einheit 3 ausgeführten Transaktion Tietzt überprüft. Stimmen die zuletzt gespeicherte Kontextinformation Klotzt und die der ersten Transaktion Tl zugeordnete Kontextinformation KI überein, so wird die betrachtete erste Transaktion Tl bei der Ermittlung der aktuellen Transaktion bevorzugt berücksichtigt, d.h. die aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI über die in der Parsereinheit 8 ausgeführte Grammatikroutine GR der betrachteten Transaktion Tl ausgewertet. Die Kontextinformation KI kann beispielsweise den Parametertyp „String" aufweisen, der einen den Sinnzusammenhang zwischen den Transaktionen Tl bis Tx wiedergebenden Oberbegriff darstellt.
Zusätzlich ist jeder Transaktion Tl - Tx eine Transaktionsparameterroutine TPR zugeordnet, die - neben den ermittelten Transaktionsparametern Pl - Px - Transaktionsparameterprompts TPP, eine Parametergrammatik PGR sowie eine Wertermittlungsinformation WEI aufweist. Die Transaktion Tl wird durch ihre Transaktionsparameter Pl - Px inhaltlich spezifiziert, deren Werte über die Transaktionsparameterroutine TPR ermittelt werden. Hierzu werden über die in Parsereinheit 8 ausgeführte Parametergrammatik PGR aus den Aktionsinformationen AI die Werte der Transaktionsparameter Pl - Pix ermittelt. Die zur Ausführung der Transaktion Tl - Tx noch zu bestimmenden Transaktionsparameter Pl - Px werden durch Ausgabe des jeweils zugeordneten Transaktionsparameterprompts TPP an den Benutzer B und dessen in einer weiteren Benutzeräußerung BE enthaltenen Aktionsinformationen AI im Rahmen eines Klärungsdialoges abgefragt. Ferner wird über jeweils den einzelnen Transaktionsparametern Pl - Px zugeordnete Wertermittlungsinformationen WEI festgelegt, auf welche Weise die Ermittlung der Transaktionsparameter Pl - Px erfolgen soll bzw. kann. Beispielsweise können zur Ermittlung der Transaktionsparameter Pl - Px neben der
Durchführung eines Klärungsdialogs mit dem Benutzer B bereits im Sprachdialogsystem 1 vorliegende Parameterwerte bzw. Statusinformationen ausgewertet werden. Hierzu wird die Abhängigkeit eines Transaktionsparameters Pl - Px von dem Vorlie- gen oder Nicht-Vorliegen eines vorgegebenen Dialogstatus ausgewertet. Somit können mit Hilfe von Wertermittlungsinformationen WEI unterschiedliche Wege zur Ermittlung des Wertes eines Transaktionsparameters Pl - Px vorgegeben werden, wodurch unnötige Benutzerabfragen im Rahmen eines Klä- rungsdialoges vermieden werden können.
Zur Überprüfung der Gültigkeit eines geänderten Transaktionsparameters ist eine Constraint-Routine CR pro Transaktion Tl - Tx vorgesehen, welche Triggerparameter TR, logische Bedin- gungen LB sowie Aktionsanweisungsprompts AA umfasst. Über die Contraint-Routine CR wird somit der geänderte Parameterwert eines Transaktionsparameters Pl - Px auf seine Gültigkeit mit Hilfe der vorgegebenen Triggerparameter TR sowie der logischen Bedingung LB ermittelt und bei einem Abweichen über Ak- tionsanweisungsprompts AA an dem Benutzer B kommuniziert.
Beispielsweise wird als logische Bedingung LB vorgegeben, die Summe aus zwei Transaktionsparametern Pl, P2 zu bilden und zu überprüfen, ob diese beispielsweise einen oberen Grenzwert Pmax überschreitet. Beim Überschreiten des oberen Grenzwertes Pmax wird der zugeordnete Aktionsanweisungsprompt AA der
Contraint-Routine CR ausgegeben. Alternativ kann auch abhängig von der Auswertung der logischen Bedingung LB eine vorgegebene Systemfunktion initiiert werden.
Über eine Nachbedingungsroutine NBR wird überprüft, ob sämtliche für die Ausführung der jeweiligen Transaktion Tl - Tx erforderlichen Nachbedingungen NB, beispielsweise die für die Ausführung zumindest erforderlichen Transaktionsparameter Pl - Px, nunmehr vorliegen, d.h. die Lücken der als Rahmen modellierten Transaktion Tl gefüllt sind und mit Hilfe der ausgewählten Transaktion Tl die zugeordnete Funktion der Hintergrundapplikation HA nunmehr gestartet werden kann. Somit wer- den über die Nachbedingungsroutine NBR diejenigen Nachbedingungen NB überprüft, welche am Ende des Dialoges vorliegen müssen, um eine Übergabe sämtlicher für die Bedienung der Hintergrundapplikation HA erforderlichen Informationen über die Transaktion Tl zu gewährleisten. Vorteilhaft können durch die Nachbedingungsroutine NBR unterschiedlich komplexe Nachbedingungen NB für unterschiedliche Transaktionen Tl - Tx individuell definiert und abgeprüft werden.
Schließlich weist eine Transaktion Tl - Tx eine Systemakti- onsroutine SAR auf, mit deren Hilfe die Ausgabe von spezifischen Aktionsprompts AP bzw. Systemaktionen SA umgesetzt wird. Die Systemaktionsroutine SAR umfasst hierzu beispielsweise Systemtriggerparameter TRP sowie Vorbedingungsinformationen VBI als auch vorgegebene Systemaktionen SA. Bei einer Änderung der Systemtriggerparameter TRP wird über die Vorbedingungsinformationen VBI die Initiierung der vorgegeben Systemaktionen SA verifiziert und gegebenenfalls die zugeordneten Systemaktionen SA gestartet. Mit Hilfe der Systemaktionsroutine SAR wird somit der Benutzer B über eine Änderung des Dialogstatus oder des Status der Hintergrundapplikation HA informiert .
In Figur 3 ist das erfindungsgemäße Verfahren zur Ermittlung zumindest einer Transaktion Tl -Tx im Sprachdialogsystem 1 in einem Ablaufdiagramm beispielhaft dargestellt. Mittels einer in der Steuereinheit 9 ausgeführten Auswahlroutine AR werden die in Figur 3 dargestellten fünf Verfahrensschritte Sl - S5 abgearbeitet. Zunächst wird in einem ersten Schritt Sl den in einem Sinnzusammenhang stehenden Transaktionen Tl - Tx je- weils eine übereinstimmende Kontextinformation KI zugeordnet.
Ferner wird im Rahmen der Ausführung einer Transaktion Tl - Tx jeweils die dieser zugeordnete Kontextinformation KI als zuletzt zugeordnete Kontextinformation Klotzt im Sprachdia- logssystem 1 bzw. der Speichereinheit 5 der Dialog- Management-Einheit 3 gespeichert (zweiter Schritt S2).
Nach der Ermittlung der Aktionsinformationen AI aus der jeweils erfassten Benutzeräußerung BE (dritter Schritt S3) werden diejenigen Transaktionen Tl - Tx ermittelt, deren zugeordnete Kontextinformationen KI mit der zuletzt zugeordneten Kontextinformation Klotzt übereinstimmen (vierter Schritt S4) .
In einem fünften und letzten Schritt S5 werden aus der endlichen Menge der Transaktionen Tl - Tx die zuvor ermittelten Transaktionen T2, T3 für die Ermittlung der aktuellen Trans- aktion Tl - Tx bevorzugt herangezogen.
Im Folgenden wird an einem Ausführungsbeispiel der Aufbau sowie die Parameter Pl - Px einzelner Transaktionen Tl bis T4 innerhalb des Sprachdialogsystems 1 näher beschrieben. Als Hintergrundapplikation HA wird beispielhaft ein „Unified Messaging System" betrachtet, welches in der Regel eine Telefonverbindung zwischen dem Benutzer B und dem Sprachdialogsystem 1 besteht, d.h. die Eingabeeinheit 2 ist als Mikrofoneinheit eines Telefons und die Ausgabeeinheit 4 als Lautsprecherein- heit desselben ausgebildet. Als Grundfunktionen eines derartigen Unified Messaging System lassen sich folgende Funktionen nennen:
1. Benutzeridentifizierung im Sprachdialogsystem (Login) 2. Abfrage neuer Nachrichten
3. Abfrage neuer Nachrichten einer bestimmten Person
4. Senden von Nachrichten.
Zur Bedienung der genannten Grundfunktionen der Hintergrund- applikation Unified Messaging System werden vier Transaktionen Tl - T4 auf Dialoglevel modelliert, wobei beispielhaft jeweils eine Transaktion Tl - T4 eine der genannten Grundfunktionen zugeordnet ist, d.h. anhand der ersten Transaktion Tl wird die Benutzeridentifizierung, anhand der zweiten Transaktion T2 das Abhören von neuen Nachrichten, über die dritte Transaktion T3 das Abhören von Nachrichten einer bestimmten Person und mittels der vierten Transaktion T4 das Senden von Nachrichten über das Sprachdialogsystem 1 gesteuert .
Erste Transaktion Tl : „Benutzeridentifizierung"
Über die Dialog-Management-Einheit 3 werden anhand der Grammatikroutine GR die aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI mit den zur Ausführung der ersten Transaktion Tl erforderlichen Grammatiken Gl - Gx bzw. deren Schlüsselbegriffe verglichen und bei Übereinstimmung die zu- gehörige Transaktion Tl gestartet.
Für die weitere Ausführung der ersten Transaktion Tl „Benutzeridentifizierung" ist es erforderlich, dass der Benutzer B noch nicht im Sprachdialogsystem 1 angemeldet ist. Dies ent- spricht zugleich dem Vorbedingungsparameter VBP für die Ausführung der ersten Transaktion Tl, welcher über die Vorbedingungsroutine VBR überprüft wird. Ist der Benutzer B bereits im Sprachdialogssystem 1 eingeloggt, so wird die Ausführung der ersten Transaktion Tl unterbrochen und dem Benutzer B ein entsprechendes Aktionsprompt AP ausgegeben. Ist der Benutzer noch nicht im Sprachdialogssystem 1 angemeldet, wird die erste Transaktion Tl weiter ausgeführt und anhand der Transaktionsparameterroutine TPR die der ersten Transaktion Tl „Benutzeridentifizierung" zugeordneten Transaktionsparame- ter Pl="Benutzername" und P2="Passwort" ermittelt. Als Benutzername wird im Folgenden beispielhaft die Telefonnummer des Benutzers B angenommen.
Der Benutzer B gibt als Benutzeräußerung BE seine Telefonnum- mer und das zugehörige Passwort in das Sprachdialogsystem 1 ein. Die Benutzeräußerung BE wird über die Eingabeeinheit 2 erfasst und anhand der Spracherkennungseinheit 6 die in der Benutzeräußerung BE enthaltene Telefonnummer und das Passwort ermittelt sowie als Aktionsinformationen AI in der Speichereinheit 5 gespeichert. Mittels der Transaktionsparameterroutine TPR werden aus den gespeicherten Aktionsinformationen AI die zur Ausführung der ersten Transaktion Tl erforderli- chen ersten und zweiten Transaktionsparameter Pl =„Benutzername" und P2=„Passwort" bestimmt.
Über die Nachbedingungsroutine NBR wird das Vorliegen der für die Ausführung der der ersten Transaktion Tl „Benutzeridenti- fizierung" zugeordneten Funktion der Hintergrundapplikation
HA „Unified Messaging System" erforderlichen ersten und zweiten Transaktionsparameter Pl, P2 überprüft und anschließend die zugehörige Funktion aufgerufen. Ferner wird ein den Status des Identifizierungsprozesses anzeigender Aktionsprompt AP an den Benutzer B über die Ausgabeeinheit 4 ausgegeben.
Abschließend oder zu einem beliebig gewählten Zeitpunkt während der Transaktionsverarbeitung wird gegebenenfalls eine der ersten Transaktion Tl zugeordnete Kontextinformation KI in der Speichereinheit 5 gespeichert.
Die geschilderte Dialogabfolge wird anhand der nachfolgenden schematischen Tabellendarstellung nochmals kurz zusammenge- fasst :
Figure imgf000017_0001
Zweite Transaktion T2 : „Abfrage neuer Nachrichten"
Der Benutzer B gibt hierzu beispielsweise folgende Benutzer- äußerung BE in das Sprachdialogsystem 1 ein: „Ich möchte meine neuen Nachrichten abhören". Die Benutzeräußerung BE wird über die Eingabeeinheit 2 erfasst und anhand der Spracherken- nungseinheit 6 die in der Benutzeräußerung BE enthaltene Aktionsinformationen AI ermittelt und in der Speichereinheit 5 gespeichert. Mögliche Aktionsinformationen AI können hierbei die Begriffe „neue", „Nachrichten" und „abhören" sein.
Über die Kontextinformationsroutine KIR wird zunächst die jeweils einer Transaktion Tl - Tx zugeordnete Kontextinformati- on KI mit der der zuletzt abgespeicherten Kontextinformation Klotzt verglichen und bei einer Übereinstimmung dieser die betrachtete Transaktion T2, T3 bevorzugt zur Ermittlung der aktuellen Transaktion T2 herangezogen. Alternativ kann mittels der in der Steuereinheit 9 ausgeführten Auswahlroutine AR die zuletzt abgespeicherte Kontextinformation Klotzt geladen werden und nach Abfrage der Kontextinformationen KI der einzelnen Transaktionen Tl - Tx diejenigen Transaktionen T2, T3 mit übereinstimmender Kontextinformation KI für die Ermittlung der aktuellen Transaktion T2, T3 bereitgestellt wer- den.
Anschließend wird die jeweilige Grammatikroutine GR der in einem Sinnzusammenhang stehenden, d.h. dieselbe Kontextinformation KI aufweisenden Transaktionen T2, T3 gestartet und die Übereinstimmung der aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI mit den zur Ausführung der zweiten bzw. dritten Transaktion T2,T3 erforderlichen Grammatiken Gl - Gx bzw. deren Schlüsselbegriffe überprüft und bei Übereinstimmung die ermittelte Transaktion T2 gestartet. Im vorlie- genden Fall ist der zweiten Transaktion T2 „Abfrage neuer
Nachrichten" beispielsweise die Kontextinformation „Unified Messaging System: Nachrichtenabfrage" zugeordnet, welche bei Ausführung der zweiten Transaktion T2 wiederum in der Spei- chereinheit 5 der Dialog-Management-Einheit 3 als zuletzt zugeordnete Kontextinformation Klotzt gespeichert wird.
Bevor die ermittelte zweite Transaktion T2 „Abfrage neuer Nachrichten" weiter ausgeführt wird, wird analog zuvor anhand der zugeordneten Vorbedingungsroutine VBR überprüft, ob die erste Transaktion Tl „Benutzeridentifizierung" erfolgreich durchgeführt wurde, d.h. der Benutzer B im Sprachdialogsystem angemeldet bzw. eingeloggt ist.
Über die Nachbedingungsroutine NBR der zweiten Transaktion T2 wird im Anschluss die der zweiten Transaktion T2 zugeordnete Funktion („Abfragen neuer Nachrichten") der Hintergrundapplikation HA „Unified Messaging System" aufgerufen und der zugehörige Informationsprompt AP zusammen mit den Nachrichten an den Benutzer B über die Ausgabeeinheit 4 ausgegeben.
Die der zweiten Transaktion T2 zugrundeliegende Dialogstruktur lässt sich somit beispielhaft wie folgt schematisch dar- stellen:
Figure imgf000019_0001
Dritte Transaktion T3 : „Abfrage neuer Nachrichten einer bestimmten Person"
Die abgegebene Benutzeräußerung BE „Ich möchte die neuen Nachrichten von Herrn Maier abhören" wird wiederum über die Eingabeeinheit 2 erfasst und anhand der Spracherkennungsein- heit 6 die in der Benutzeräußerung BE enthaltene Aktionsinformationen AI ermittelt, welche in der Speichereinheit 5 gespeichert wird. In der Dialog-Management-Einheit 3 ist nach der Ausführung der zweiten Transaktion T2 als zuletzt abgespeicherte Kontextinformation Klotzt „Unified Messaging System: Nachrichtenabfrage" gespeichert.
Über die jeweilige Kontextinformationsroutine KIR der Trans- aktionen Tl -Tx wird die Übereinstimmung mit der Kontextinformation „Unified Messaging System: Nachrichtenabfrage" geprüft und aufgrund der Übereinstimmung der Kontextinformation KI der dritten Transaktion T3 mit der zuletzt abgespeicherten Kontextinformation Klotzt diese bevorzugt herangezogen.
Anschließend wird die jeweilige Grammatikroutine GR der dritten Transaktion T3 gestartet und die Übereinstimmung der aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI mit den zur Ausführung der dritten Transaktion T3 erforderli- chen Grammatiken Gl - Gx bzw. deren Schlüsselbegriffe überprüft und bei Übereinstimmung dieser die dritte Transaktion T3 weiter ausgeführt.
In analoger Weise wird anhand der Vorbedingungsroutine VBR auch im Rahmen der dritten Transaktion T3 die erfolgreiche Ausführung der ersten Transaktion Tl „Benutzeridentifizierung" überprüft und aus den gespeicherten Aktionsinformationen AI über die Transaktionsparameterroutine TPR als Transaktionsparameter Pl=„Name" der Name der Person („Herr Maier") ermittelt, dessen neue Nachrichten dem Benutzer B ausgegeben werden sollen. Ebenso wird die Kontextinformation KI „Unified Messaging System: Nachrichtenabfrage" in der Speichereinheit 5 als zuletzt vorliegende Kontextinformation Klotzt gespeichert .
Anhand der folgenden Tabelle werden die beschriebenen Schritte der dritten Transaktion T3 beispielhaft anhand einer Tabelle dargestellt:
Figure imgf000021_0001
Vierte Transaktion T4 : „Senden einer Nachricht"
Um eine Nachricht über das Unified Messaging System aufzuzeichnen und anschließend an eine ausgewählte Person zu versenden ist die vierte Transaktion T4 vorgesehen.
Diese wird durch den Benutzer B mittels der Eingabe beispielsweise der Benutzeräußerung BE=„Ich möchte eine Nachricht an Herrn Maier senden" initiiert. Die Benutzeräußerung BE wird wiederum über die Eingabeeinheit 2 erfasst und anhand der Spracherkennungseinheit 6 die in der Benutzeräußerung BE enthaltene Aktionsinformationen AI ermittelt und in der Speichereinheit 5 gespeichert.
Unter Berücksichtigung der in der Dialog-Management-Einheit 3 nach der Ausführung der dritten Transaktion T3 zuletzt gespeicherten Kontextinformation Klotzt „Unified Messaging System: Nachrichtenabfrage" werden zunächst die Grammatikroutinen GR der zweiten und dritten Transaktionen T2, T3 auf Übereinstimmungen mit den gespeicherten Aktionsinformationen AI überprüft und im Anschluss daran die weiteren Transaktionen T4 - Tx herangezogen.
Schließlich wird die Grammatikroutine GR der vierten Transaktion T4 gestartet und die Übereinstimmung der aus der Benut- zeräußerung BE gewonnenen Aktionsinformationen AI mit den zur Ausführung der vierten Transaktion T4 erforderlichen Grammatiken Gl - Gx bzw. deren Schlüsselbegriffe überprüft und aufgrund deren Übereinstimmung mit den gespeicherten Transaktionsinformationen die vierte Transaktion T4 weiter ausgeführt.
Als Vorbedingung ist hierbei wiederum die erfolgreiche Anmeldung des Benutzers im System erforderlich, welche anhand der Vorbedingungsroutine VBR verifiziert wird.
Um eine Nachricht an den vorgegebenen Empfänger „Herrn Maier" zu senden, ist es zunächst erforderlich, dass der Benutzer BE die Nachricht in das Sprachdialogsystem 1 eingibt. Die Nachricht wird über die Dialog-Management-Einheit 3 als erster Transaktionsparameter Pl=,,Message" aufgezeichnet. Nachdem der Benutzer die Nachricht eingegeben hat, hat dieser die Möglichkeit die korrekte Eingabe durch Abhören der aufgezeichneten Nachricht überprüfen zu können. Der Benutzer B kann hierzu über einen zweiten Transaktionsparameter P2=,,Listen" festlegen, ob er die aufgenommene Nachricht abhören will oder nicht.
Auch sollte durch das Sprachdialogsystem 1 bei einer fehlerhaften Aufnahme der Benutzer B dahingehend Unterstützung er- fahren, dass eine erneute Aufnahme der Nachricht initiiert wird. Ist die aufgezeichnete Nachricht korrekt, so soll anhand eines dritten Transaktionsparameters P3=„Confirm Message" dem Sprachdialogsystem 1 angezeigt werden, dass die auf- gezeichnete Nachricht weiterbearbeitet werden kann.
Alternativ ist durch das Vorsehen der Wertermittlungsinformation WEI auch eine indirekte Bestätigung der korrekten Aufnahme der Nachricht, d.h. ohne Benutzereingriff möglich. Hierzu wird die Abhängigkeit zwischen dem zweiten und dritten Transaktionsparameter P2=„Listen" und P3=„Confirm Message" verwertet, und zwar derart, dass über die Wertermittlungsroutine WEI automatisch der Wert des dritten Transaktionsparameters P3="Confirm Message" auf „Ja" gesetzt wird und somit ei- ne Weiterverarbeitung der aufgezeichneten Nachricht ohne nochmaliges Abspielen umgesetzt wird, sofern der zweite Transaktionsparameter P3="Listen" den Wert „Nein" aufweist.
Nach erfolgter Bestätigung der fehlerfreien Aufzeichnung der Nachricht wir mittels der Transaktionsparameterroutine TPR der Wert des vierten Transaktionsparameters P4="Receiver", nämlich der Empfänger der aufgezeichneten Nachricht, ermittelt.
Schließlich wird nochmals mittels einem fünften Transaktionsparameter P5="Confirm Sending" vom Benutzer B die Bestätigung zum Absenden der aufgezeichneten Nachricht an den im Dialog- Management-System 3 gespeicherten Empfänger („Herrn Maier") abgefragt .
Zusätzlich können noch die Übermittlungsparameter bzgl. der aufgezeichneten Nachricht als weitere Transaktionsparameter P6 - Px („Special Settings") , beispielsweise die Vertraulichkeit, Dringlichkeit, Verschlüsselung etc., mittels eines wei- teren Klärungsdialogs vom Benutzer B abgefragt werden.
Ferner werden abhängig von Systemtriggerparameter TRR bzgl. der vorliegenden Transaktionsparameter Pl - Px mittels der Systemactionroutine SAR zu den unterschiedlichen Systemtriggerparameter TRR zugeordnete Systemactions SA ausgeführt. Beispielsweise wird bei einem den Wert „Ja" aufweisenden zweiten Transaktionsparameter P2=„Listen" die Ausgabe der aufgezeichneten Nachricht gestartet und bei einem den Wert „Nein" aufweisenden dritten Transaktionsparameter P3=„Confirm Message" oder einem den Wert „Nein" aufweisenden fünften Transaktionsparameter P5="Confirm Sending" das Löschen der aufgezeichneten Nachricht vorgenommen.
Über die Kontextinformationsroutine KIR wird auch im Rahmen der vierten Transaktion T4 die Kontextinformation KI „Unified Messaging System: Nachrichtenversand" in der Speichereinheit 5 als zuletzt vorliegende Kontextinformation Klotzt gespeichert .
Über die Nachbedingungsroutine NBR der vierten Transaktion T4 wird die zugeordnete Funktion („Nachricht senden") innerhalb des Unified Messaging Systems aufgerufen und der zugehörige Informationsprompt AP erzeugt und über die Ausgabeeinheit 4 ausgegeben.
Im Folgenden wird anhand einer Tabelle die Modellierung der vierten Transaktion T4 schematisch dargestellt:
Figure imgf000024_0001
Figure imgf000025_0001
Basierend auf der erläuterten Spezifizierung von vier Transaktionen Tl bis T4 wird im Folgenden beispielhaft ein Dialog zwischen einem Benutzer B und dem Sprachdialogsystem 1 beschrieben.
System (APl) : Willkommen im Unified Messaging System. Bitte identifizieren Sie sich im System.
Benutzer (BEI) 123456 System (AP2) : Telefonnummer 123456, bitte geben Sie Ihr Passwort ein.
Benutzer (BE2) 333666 System (AP3) : Sie sind im System eingeloggt. Was kann ich für Sie tun?
Benutzer (BE3) Ich möchte alle neuen Nachrichten von Herrn Maier abhören. System (AP4) : Nachrichten von Herrn Maier ... einen Moment bitte ... System (AP5) : Sie haben zwei neue Nachrichten von Herrn Maier: Erste Nachricht ...; Zweite Nachricht ...
Benutzer (BE4) Ich möchte eine Nachri cht an Herrn Maier senden . System (AP6) : Bitte geben Sie Ihre Nachricht ein und drücken Sie nach Ihrer Eingabe die #- Taste.
Benutzer (BE5) Sehr geehrter Herr Maier, ich nehme ... (# gedrückt) System (AP7) : Wollen Sie Ihre aufgenommen Nachricht abhören?
Benutzer (BEβ) Nein System (AP8) : Wollen Sie die Nachricht normal senden? Benutzer (BEI) Ja System (AP9) : Ihre Nachricht wurde gesendet.
Anhand der nachfolgenden tabellarischen Darstellung wird die Veränderung der jeweiligen Transaktionsparameter Pl -Px im Rahmen des beschriebenen Dialoges tabellarisch dargestellt: BE4 : Ich möchte eine Nachricht an Herrn Maier senden.
Figure imgf000027_0001
BE5: Sehr geehrter Herr Maier, ich nehme ... (# gedrückt)
Figure imgf000027_0002
BE6: Nein
Figure imgf000027_0003
BE7: Ja
Figure imgf000028_0001
Über die Vorbedingungsparameter VBP sowie die zugeordneten Kontextinformationen KI wird somit eine schnelle Identifizie- rung der vom Benutzer B gewünschten Funktion der Hintergrundapplikation bzw. der dieser zugeordneten Transaktion Tl - Tx realisiert. Insbesondere durch die Abspeicherung der zuletzt vorliegenden Kontextinformation Klotzt in der Speichereinheit 5 der Dialog-Management-Einheit 3 und die zunächst beschränk- te Auswertung der mit den erhaltenen Aktionsinformationen AI im Hinblick auf die eine übereinstimmende Kontextinformation KI aufweisenden Transaktionen T2, T3 einer Transaktionsgruppe TGl wird die Nutzerfreundlichkeit sowie der Bedienkomfort des Sprachdialogsystems 1 deutlich erhöht.
Die Erfindung wurde voranstehend anhand eines Ausführungsbeispiels näher beschrieben. Es versteht sich von selbst, daß zahlreiche Modifikationen sowie Abwandlungen möglich sind, ohne daß dadurch der der Erfindung zugrunde liegende Erfin- dungsgedanke verlassen wird. Bezugszeichenliste
1 Sprachdialogsystem
2 Eingabeeinheit 3 Dialog-Management-Einheit
4 Ausgabeeinheit
5 Speichereinheit
6 Spracherkennungseinheit
7 Sprachsyntheseeinheit 8 Parsereinheit
9 Steuereinheit
AA Aktionsprompts
AI Aktionsinformation
AP, AP1-AP9 Ausgabeprompt AR Auswählroutine
B Benutzer
BE, BE1-BE7 Benutzeräußerung
CR Constraint-Routine
DBS DatenbusSystem Gl-Gx Grammatiken
Gl*-Gx* kontextabhängige Grammatiken
GR Grammatikroutine
HA Hintergrundapplikation
KI Kontextinformation Klotzt zuletzt gespeicherte Kontextinformation
KIR Kontextinformationsroutine LB logische Bedingungsparameter NBA Nachbedingungsaktionen NBP Nachbedingungsparameter NBR Nachbedingungsroutine
Pl-Px Transaktionsparameter
tmax oberer Grenzwert
PGR Parametergrammatiken PP Parameterprompt S1-S5 erster bis fünfter Schritt SA Systemaction SAR Systemactionroutine Tl-Tx Transaktionen Tietzt zuletzt ausgeführte Transaktion
TG Transaktionsgruppe
TPP Triggerparameter
TPR Transaktionsparameterroutine TRR Systemtriggerparameter
VBI Vorbedingungsinformationen
VBP Vorbedingungsparameter
VBR Vorbedingungsroutine
VBR Vorbedingungsroutine VB Vorbedingung
WEI Wertermittlungsinformation

Claims

Patentansprüche
1. Verfahren zur Ermittlung zumindest einer Transaktion (Tl - Tx) zur Bedienung einer Hintergrundapplikation (HA) unter Auswertung von zumindest einer in einer Benutzeräußerung (BE) enthaltenen Aktionsinformation (AI) in einem Sprachdialogsystem (1) , wobei jeweils einer Hintergrundapplikation (HA) eine endliche Menge auswählbarer Transaktionen (Tl - Tx) zugeordnet sind und bei dem über eine im Sprachdialogsystem (1) vor- gesehene Eingabeeinheit (2) zumindest eine Benutzeräußerung (BE) erfasst und im Sprachdialogsystem (1) gespeichert wird, dadurch gekennzeichnet, dass in einem Sinnzusammenhang stehenden Transaktionen (T2, T3) im Sprachdialogsystem (1) jeweils zumindest ei- ne übereinstimmende Kontextinformation (KI) zugeordnet wird, dass die Kontextinformation (Klotzt) zumindest der zuletzt ausgeführten Transaktion (Tietzt) im Sprachdialogsystem gespeichert wird und - dass zur Ermittlung der aktuellen Transaktion (Tl - Tx) bevorzugt diejenigen Transaktionen (T2, T3) berücksichtigt werden, deren zugeordnete Kontextinformation (KI) mit der gespeicherten Kontextinformation (Klotzt) übereinstimmt .
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die in einem Sinnzusammenhang stehenden Transaktionen (T2, T3) zu einer Transaktionsgruppe (TGl) mit jeweils über- einstimmender Kontextinformation (KI) zusammengefasst werden.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die aktuelle Transaktion (Tl - T4) mittels der jeweils einer Transaktion (Tl-Tx) zugeordneten Grammatikroutine (GR) und dieser zugeordneter Grammatiken (Gl - Gx) durch Auswertung der in der Benutzeräußerung (BE) enthaltenen Aktionsinformationen (AI) ermittelt wird.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass im Sprachdialogsystem (1) jeweils einer Transaktion (Tl - Tx) eine vorgebbare Anzahl an Transaktionsparametern (Pl - Px) zugeordnet wird.
5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die zumindest eine in der gespeicherten Benutzeräußerung (BE) enthaltene Aktionsinformation (AI) mit Hilfe einer Spracherkennungseinheit (6) ermittelt wird.
6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass zumindest einer der Transaktionen (Tl - Tx) zumindest ein Vorbedingungsparameter (VBP) zugeordnet wird.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass das Vorliegen des zumindest einen zugeordneten Vorbedingungsparameters (VBP) mittels einer zugehörigen Vorbedingungsroutine (VBR) verifiziert wird.
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass durch die Vorbedingungsroutine (VBR) die Aktivierung bzw. Deaktivierung einer weiteren Transaktion (Tl) überprüft wird.
9 . Verfahren nach Anspruch 8 , d a d u r c h g e k e n n z e i c h n e t , dass abhängig vom Ergebnis der Überprüfung ein im Sprachdialogsystem (1) gespeicherter, zugeordneter Parameterprompt (PP) ausgewählt und über die Ausgabeeinheit (4) ausgegeben wird oder die Ausführung der aktuell ermittelten Transaktion (T2, T3, T4) fortgeführt wird.
10. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass zumindest einer der Transaktionen (Tl - Tx) zumindest ein Nachbedingungsparameter (NBP) zugeordnet wird.
11. Verfahren nach Ansprüche 10, dadurch gekennzeichnet, dass nach der Ausführung der aktuell ermittelten Transaktion (Tl, T2, T3, T4) eine zugehörige Nachbedingungsroutine (BNR) gestartet wird und mittels dieser das Vorliegen der zugeordneten Nachbedingungsparameter (NBP) überprüft sowie zugeordnete Nachbedingungsaktionen (NBA) initiiert werden.
12. Verfahren nach einem der Ansprüche 4 bis 11, dadurch gekennzeichnet, dass der Parameterwert eines Transaktionsparameters (Pl - Px) mittels einer Transaktionsparameterroutine (TPR) ermittelt wird, wobei zumindest einem Transaktionsparameter (P5) eine Wertermittlungsinformation (WEI) zugeordnet ist, die den Er- mittlungsweg angibt.
13. Verfahren nach einem der Ansprüche 4 bis 12, dadurch gekennzeichnet, dass bei einer Änderung eines Transaktionsparameters (Pl - Px) einer Transaktion (Tl - Tx) die Gültigkeit des geänderten Transaktionsparameters (Pl - Px) überprüft wird.
14. Verfahren nach Anspruch 13, dadurch gekennzeichnet, dass die Überprüfung der Gültigkeit des geänderten Transaktionsparameters (Pl - Px) mittels einer Constraint-Routine (CR) durchgeführt wird, welche Trigger-Parameter (TR) , zumindest eine logische Bedingung (LB) und Aktionsanweisungsprompts (AA) umfasst.
15 . Verfahren nach einem der Ansprüche 1 bis 14 , d a d u r c h g e k e n n z e i c h n e t , dass dem Benutzer (B) des Sprachdialogsystem (1) während der Ausführung der aktuell ermittelten Transaktion (Tl - Tx) einer Hintergrundapplikation (HA) vorgegebene Informationsbzw. Aktionsprompts (AP) angezeigt werden.
16. Verfahren nach Anspruch 15, dadurch gekennzeichnet, dass die vorgegebenen Informations- bzw. Aktionsprompts (AP) mit Hilfe einer System-Action-Routine (SAR) ermittelt werden, welche Trigger-Parameter (TRR) , Vorbedingungsinformationen (VBI) und vorgegebene Systemactions (SA) umfasst.
17. Verfahren nach Anspruch 1 bis 16, dadurch gekennzeichnet, dass den einzelnen Transaktionen (Tl - T4) jeweils eine von der zugeordneten Kontextinformation (KI) abhängige Grammatik (Gl*- Gx*) zugeordnet wird.
18. Sprachdialogsystem zur Durchführung des Verfahrens gemäß einer der Ansprüche 1 bis 17 bestehend aus zumindest einer
Eingabeeinheit (2), einer Dialog-Management-Einheit (3) und einer Ausgabeeinheit (4), dadurch gekennzeichnet,
- dass die Dialog-Management-Einheit (3) eine Steuerein- heit (9) zur Zuordnung zumindest einer übereinstimmenden
Kontextinformation (KI) zu in einem Sinnzusammenhang stehenden Transaktionen (T2, T3) aufweist,
- dass eine Speichereinheit (5) zur Speicherung zumindest der Kontextinformation (Klotzt) der zuletzt ausgeführten Transaktion (Tietzt) vorgesehen ist und dass eine in der Steuereinheit (9) ausgeführte Auswahlroutine (AR) vorgesehen ist, die bevorzugt diejenigen Transaktionen (T2, T3) für die Ermittlung der aktuellen Transkation (Tl - Tx) auswählt, deren zugeordnete Kon- textinformation (KI) mit der gespeicherten Kontextinformation (Klotzt) übereinstimmt.
19. Sprachdialogsystem nach Anspruch 18, dadurch gekennzeichnet , dass die zu bedienende Hintergrundapplikation (HA) als „Uni- fied Messaging Systeme" ausgebildet ist.
PCT/EP2006/064501 2005-08-09 2006-07-21 Verfahren und sprachdialogsystem zur ermittlung zumindest einer transaktion zur bedienung einer hintergrundapplikation Ceased WO2007017361A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102005037621.5 2005-08-09
DE102005037621A DE102005037621A1 (de) 2005-08-09 2005-08-09 Verfahren und Sprachdialogsystem zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation

Publications (1)

Publication Number Publication Date
WO2007017361A1 true WO2007017361A1 (de) 2007-02-15

Family

ID=37179086

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2006/064501 Ceased WO2007017361A1 (de) 2005-08-09 2006-07-21 Verfahren und sprachdialogsystem zur ermittlung zumindest einer transaktion zur bedienung einer hintergrundapplikation

Country Status (2)

Country Link
DE (1) DE102005037621A1 (de)
WO (1) WO2007017361A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9661138B2 (en) 2015-01-14 2017-05-23 Unify Gmbh & Co. Kg System and method for automatic intention evaluation and communication routing

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008025532B4 (de) * 2008-05-28 2014-01-09 Audi Ag Kommunikationssystem und Verfahren zum Durchführen einer Kommunikation zwischen einem Nutzer und einer Kommunikationseinrichtung

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1033701A2 (de) * 1999-03-01 2000-09-06 Matsushita Electric Industrial Co., Ltd. Verfahren und Vorrichtung zur Fernsehkanalauswahl unter Verwendung von Sprachverständnis
WO2001078065A1 (en) * 2000-04-06 2001-10-18 One Voice Technologies, Inc. Natural language and dialogue generation processing
EP1335352A1 (de) * 2002-02-11 2003-08-13 Sony International (Europe) GmbH Dialogverwaltungsserver und Verfahren zur Dialogverwaltung
WO2006037219A1 (en) * 2004-10-05 2006-04-13 Inago Corporation System and methods for improving accuracy of speech recognition

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1033701A2 (de) * 1999-03-01 2000-09-06 Matsushita Electric Industrial Co., Ltd. Verfahren und Vorrichtung zur Fernsehkanalauswahl unter Verwendung von Sprachverständnis
WO2001078065A1 (en) * 2000-04-06 2001-10-18 One Voice Technologies, Inc. Natural language and dialogue generation processing
EP1335352A1 (de) * 2002-02-11 2003-08-13 Sony International (Europe) GmbH Dialogverwaltungsserver und Verfahren zur Dialogverwaltung
WO2006037219A1 (en) * 2004-10-05 2006-04-13 Inago Corporation System and methods for improving accuracy of speech recognition

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9661138B2 (en) 2015-01-14 2017-05-23 Unify Gmbh & Co. Kg System and method for automatic intention evaluation and communication routing
US9883039B2 (en) 2015-01-14 2018-01-30 Unify Gmbh & Co. Kg System and method for automatic intention evaluation and communication routing
US10154141B2 (en) 2015-01-14 2018-12-11 Unify Gmbh & Co. Kg System and method for automatic intention evaluation and communication routing

Also Published As

Publication number Publication date
DE102005037621A1 (de) 2007-02-22

Similar Documents

Publication Publication Date Title
EP1964110B1 (de) Verfahren zur ansteuerung von zumindest einer ersten und zweiten hintergrundapplikation über ein universelles sprachdialogsystem
DE69839068T2 (de) System und Verfahren zur automatischen Verarbeitung von Anruf und Datenübertragung
CN107038220B (zh) 用于生成备忘录的方法、智能机器人及系统
DE69835718T2 (de) Verfahren und Gerät zur Sprachinteraktion über ein Netzwerk unter Verwendung von parametrierbaren Interaktionsdefinitionen
DE60033733T2 (de) Datenbankabfragesystem basierend auf Spracherkennung
DE60222093T2 (de) Verfahren, modul, vorrichtung und server zur spracherkennung
DE60313706T2 (de) Spracherkennungs- und -antwortsystem, Spracherkennungs- und -antwortprogramm und zugehöriges Aufzeichnungsmedium
EP3652664A1 (de) Verfahren zur dialogführung zwischen mensch und computer
EP0852051A1 (de) Verfahren zur automatischen steuerung eines oder mehrerer geräte durch sprachkommandos oder per sprachdialog im echtzeitbetrieb und vorrichtung zum ausführen des verfahrens
EP3108476B1 (de) Verfahren zur erfassung wenigstens zweier zu erfassender informationen mit zu verknüpfendem informationsgehalt durch eine sprachdialogeinrichtung, sprachdialogeinrichtung und kraftfahrzeug
DE102007033472A1 (de) Verfahren zur Spracherkennung
DE19933524A1 (de) Verfahren zur Eingabe von Daten in ein System
US7668716B2 (en) Incorporation of external knowledge in multimodal dialog systems
WO1998010413A1 (de) Sprachverarbeitungssystem und verfahren zur sprachverarbeitung
EP1590797A1 (de) Kommunikationssystem, kommunikationsendeinrichtung und vorrichtung zum erkennen fehlerbehafteter text-nachrichten
DE102005060072A1 (de) Verwaltung von mehrsprachigen Nametags für eingebettete Spracherkennung
DE102019217751B4 (de) Verfahren zum Betreiben eines Sprachdialogsystems und Sprachdialogsystem
DE10110977C1 (de) Bereitstellen von Hilfe-Informationen in einem Sprachdialogsystem
DE69636731T2 (de) System und Verfahren zur Aufnahme von Namen in einer Spracherkennungsdatenbank
EP3058565B1 (de) Sprachsteuerungsverfahren sowie computerprogrammprodukt zur durchführung des verfahrens
EP1251680A1 (de) Sprachgesteuerter Verzeichnisdienst für Verbindung an ein Datennetzwerk
WO2007017361A1 (de) Verfahren und sprachdialogsystem zur ermittlung zumindest einer transaktion zur bedienung einer hintergrundapplikation
EP1340169A2 (de) Verfahren und vorrichtung zur automatischen auskunfterleitung mittels einer suchmaschine
DE60125597T2 (de) Vorrichtung für die Dienstleistungsvermittlung
EP1169841B1 (de) Erstellen eines referenzmodell-verzeichnisses für ein sprachgesteuertes kommunikationsgerät

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 06764241

Country of ref document: EP

Kind code of ref document: A1