DE10148604A1 - System for speech-generating/processing applications in telephony has devices to convert voice signals received via telephone lines into digital signals and digital signals into voice signals to be sent over the telephone lines. - Google Patents
System for speech-generating/processing applications in telephony has devices to convert voice signals received via telephone lines into digital signals and digital signals into voice signals to be sent over the telephone lines.Info
- Publication number
- DE10148604A1 DE10148604A1 DE10148604A DE10148604A DE10148604A1 DE 10148604 A1 DE10148604 A1 DE 10148604A1 DE 10148604 A DE10148604 A DE 10148604A DE 10148604 A DE10148604 A DE 10148604A DE 10148604 A1 DE10148604 A1 DE 10148604A1
- Authority
- DE
- Germany
- Prior art keywords
- telephone
- telephone interface
- voice signals
- packet
- telephone lines
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/30—Definitions, standards or architectural aspects of layered protocol stacks
- H04L69/32—Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
- H04L69/322—Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
- H04L69/329—Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the application layer [OSI layer 7]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42314—Systems providing special services or facilities to subscribers in private branch exchanges
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Human Computer Interaction (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
Die vorliegende Erfindung betrifft ein System für spracherzeugende und/oder -verarbeitende Telefonieanwendungen, d. h. ein datenverarbeitendes System, das in der Lage ist, mit einem Benutzer durch Erzeugung von natürlicher Sprache zu kommunizieren und/oder in Reaktion auf von dem Benutzer eingegebene Befehle bestimmte Aktionen durchzuführen, sowie eine Schnittstelle für ein solches System. The present invention relates to a system for voice generating and / or processing telephony applications, d. H. a data processing system that is able to work with to a user by creating natural language communicate and / or in response to from the user commands entered to perform certain actions, as well as a Interface for such a system.
Ein bekanntes Beispiel für eine spracherzeugende und/oder -verarbeitende Telefonieanwendung sind z. B. Auskunftssysteme für öffentliche Verkehrsmittel, die auf eine von einem Benutzer gesprochene Angabe von Start und Ziel einer gewünschten Reise sowie einer Reisezeit in der Lage sind, die gesprochenen Worte zu analysieren und in digitale Symbole, insbesondere in Zeichenketten, bei denen jedes Zeichen für einen Buchstaben des gesprochenen Worts steht, umzusetzen. Mit den so erhaltenen Zeichenketten als Eingabedaten wird eine Datenbank abgefragt und von der Datenbank gelieferte geeignete Reiseverbindungen werden in gesprochener Form an den Benutzer ausgegeben. A well-known example of a language-producing and / or processing telephony application are e.g. B. Information systems for public transport on one by one User spoken specification of start and destination of a desired Travel as well as a travel time are able to analyze spoken words and convert them into digital symbols, especially in strings where each character is for one Letters of the spoken word is to be implemented. With that character strings obtained as input data becomes a database queried and suitable from the database Travel connections are spoken to the user output.
Unter den Begriff der spracherzeugenden und/oder -verarbeitenden Telefonieanwendungen fallen auch solche Systeme, bei denen lediglich Sprache in Zeichen oder lediglich Zeichen in Sprache umgesetzt wird. Zur letzteren Gruppe gehören z. B. elektronische Briefkastensysteme, die von einem Benutzer telefonisch abgefragt werden können. Derartige elektronische Briefkastensysteme können einem Teilnehmer auf Befehl für ihn eingegangene E-Mails vorlesen und zu diesem Zweck nicht durch Sprache, sondern, in einfacherer Weise, durch Drücken von Tasten des Ziffernblocks des Telefons, gesteuert werden. Under the concept of language-producing and / or Processing systems also fall under such systems to them only language in characters or only characters in Language is implemented. The latter group includes e.g. B. electronic mailbox systems by a user can be queried by phone. Such electronic Mailbox systems can command a subscriber for him Read out the emails received and do not read them for this purpose Language, but, more simply, by pressing Keys on the numeric keypad of the phone.
Es existieren im wesentlichen zwei Standards für spracherzeugende und/oder -verarbeitende Telefonieanwendungen. Einer ist der sogenannte S.100-Standard der ECTF (http: / / www.ectf.org). Dieser Standard zur Vereinheitlichung von spracherzeugenden und sprachverarbeitenden Funktionen wird von Telefonieanlagen- und -endgeräteherstellern eingesetzt, z. B. zur Implementierung sprachgesteuerter Funktionen von Vermittlungsanlagen etc.. Das Steuerprogramm einer solchen Anlage, das zur Spracherzeugung und -verarbeitung auf die standardisierten S.100-Funktionen zurückgreift, wird im Allgemeinen vom Hersteller der Anlage als ein fest eingebauter Bestandteil der Anlage mit ausgeliefert. Eine Möglichkeit, dass der Benutzer nach eigenem Belieben verschiedene Steuerprogramme für unterschiedliche Anwendungen in die Anlage lädt und ausführen lässt, ist nicht vorgesehen. Hierfür bestand auch herkömmlicherweise kein Bedarf, da die von der Anlage zu erfüllenden Funktionen sich auf die Verwaltung ein- und ausgehender Anrufe sowie evtl. automatische Anrufbeantwortung beschränkten. There are essentially two standards for voice generating and / or processing telephony applications. One is the so-called S.100 standard of the ECTF (http: / / www.ectf.org). This standard for the unification of language-producing and language processing functions is from Telephony and terminal equipment manufacturers used, for. B. for Implementation of voice-controlled functions of switching systems etc .. The control program of such a system, which for Language generation and processing on the standardized S.100 functions is generally used by Manufacturer of the system as an integral part of the System delivered with. One way that the user various control programs for loads and executes different applications in the system leaves is not provided. This also existed Conventionally, there is no need, since the system has to fulfill them Functions focus on managing incoming and outgoing Restrict calls and possibly automatic answering.
Ein anderer Standard, der für spracherzeugende und/oder -verarbeitende Web-Applikationen eingesetzt wird, ist VoiceXML (Voice Extensible Markup Language), standardisiert von der W3C (www.w3.org), derzeit in der Version 1.0, herausgegeben am 5. Mai 2000 (http: / / www.w3.org/TR/voicexml / ). Dieser Standard erlaubt eine einfache Programmierung von Webseiten, die mit einem Aufrufer der Webseiten über Sprache kommunizieren, sei es durch Ausgabe von in einem VoiceXML-Skript enthaltenem Text als Sprache an einen Benutzer oder durch Verarbeiten von von dem Benutzer gesprochenen Befehlen und Ausführen bestimmter Aktionen entsprechend dieser Befehle. Dies vereinfacht erheblich die Entwicklung von spracherzeugenden und/oder -verarbeitenden Applikationen, wie etwa die bereits erwähnten Auskunftssysteme, sprachgesteuertes Teleshopping, oder gar die Übersetzung des gesprochenen Worts von einer Sprache in eine andere. Another standard that is used for language-producing and / or processing web applications is VoiceXML (Voice Extensible Markup Language), standardized by the W3C (www.w3.org), currently in version 1.0 , published on May 5 2000 (http: / / www.w3.org/TR/voicexml /). This standard allows simple programming of websites that communicate with a caller of the websites via voice, either by outputting text contained in a VoiceXML script as voice to a user or by processing commands spoken by the user and carrying out certain actions accordingly of these commands. This considerably simplifies the development of language-producing and / or processing applications, such as the information systems already mentioned, voice-controlled teleshopping, or even the translation of the spoken word from one language to another.
Applikationen in VoiceXML beanspruchen für die Spracherzeugung und -analyse eine erhebliche Rechenleistung der Server, auf denen sie laufen. Zusätzlich werden die Übertragungskapazitäten des Netzes, in das der Server eingebunden ist, stark beansprucht, da die Sprachinformationen, die er zur Steuerung benötigt bzw. die er ausgibt, in dem Datennetz als digitalisiertes Audiosignal übertragen werden müssen, was im Vergleich zur Steuerung einer Web-Applikation durch Mausklick oder Tastatureingabe eine Vergrößerung der zu übertragenen Datenmenge um ein Vielfaches bedeutet. Applications in VoiceXML claim for the Language generation and analysis a considerable computing power of the servers, on which they run. In addition, the Transmission capacity of the network in which the server is integrated is strong claimed because of the voice information he used to control required or which it outputs in the data network as digitized audio signal must be transmitted, which in Comparison to controlling a web application with a click of the mouse or keyboard input an enlargement of the transmitted Much more data means.
Anders als der S.100-Standard ermöglicht VoiceXML zwar eine einfache Programmierung von spracherzeugenden oder -verarbeitenden Anwendungen auf Hochsprachenniveau, in einem primär für die Datenübertragung ausgelegten paketorientierten Netz - wie etwa einem IP-Netz (Internet Protokoll) - ist es jedoch schwierig, zu gewährleisten, dass von einem Server erzeugte Sprachsignale einen Anwender vollständig, in korrekter Reihenfolge und in ausreichend kurzer Zeit erreichen. Im Falle der Sprachverarbeitung ist das Problem noch schwerwiegender, da in diesem Falle Aussetzer oder Verzögerungen in der Übertragung des digitalisierten Sprachsignals im paketorientierten Netz zur Folge haben können, dass ein von vom Benutzer gesprochener Befehl vom sprachverarbeitenden System nicht oder gar falsch verstanden wird. Unlike the S.100 standard, VoiceXML enables one easy programming of language generating or -processing applications at a high level, in a primary packet-oriented network designed for data transmission - such as an IP network (Internet Protocol) - but it is difficult to ensure that generated by a server Speech signals a user completely, correctly Achieve order and in a sufficiently short time. In the event of language processing, the problem is even more serious, because in this case dropouts or delays in the Transmission of the digitized speech signal in packet-oriented network can result in one of the users spoken command from the speech processing system is not or is misunderstood.
Aufgabe der Erfindung ist daher, ein System für spracherzeugende und/oder -verarbeitende Telefonieanwendungen vorzuschlagen, das einerseits geeignet ist, eine Vielzahl verschiedener Anwendungen zu unterstützen, und das andererseits Qualitätsmängel bei der Übertragung von Sprachdaten von oder zu einem Teilnehmer vermeidet. The object of the invention is therefore a system for voice generating and / or processing telephony applications propose that is suitable on the one hand, a variety to support different applications, on the other hand Quality defects in the transmission of voice data from or to a participant.
Diese Aufgabe wird gelöst durch ein System mit den Merkmalen des Anspruchs 1. This task is solved by a system with the characteristics of claim 1.
Indem beim erfindungsgemäßen System die Umsetzungsmittel zum Umsetzen von digitalen Zeichen in Sprachsignale und umgekehrt der Kontrolle der programmgesteuerten Telefonschnittstelle unterstehen, ist es möglich, die Übertragung umfangreicher digitalisierter Sprachsignale innerhalb des paketorientierten Datennetzes zu vermeiden. Innerhalb dieses Netzes müssen lediglich der Programmcode zum Steuern der Umsetzungsmittel und die von der Telefonschnittstelle aus empfangenen Sprachsignalen erzeugten Zeichen bzw. die von ihr in Sprachsignale umzusetzenden Zeichen übertragen werden. Die Übertragung der eigentlichen Sprachsignale bleibt auf die hierfür ausgelegte Telefonleitung beschränkt, so dass Laufzeitprobleme oder Übertragungsfehler im paketorientierten Netz auf die Übertragungsqualität der Sprachsignale keinen Einfluss haben. By the implementation means in the system according to the invention Converting digital characters into voice signals and vice versa control of the programmable telephone interface subordinate, it is possible to transfer more extensive digitized speech signals within the packet-oriented Avoid data network. Must be within this network only the program code for controlling the implementation means and those received from the telephone interface Speech signals generated characters or those of them in speech signals characters to be converted are transmitted. The transfer of the actual speech signals remain on the designed for this Telephone line limited, so that runtime problems or Transmission errors in the packet-oriented network on the Transmission quality of the speech signals have no influence.
Hierdurch wird nicht nur eine Verringerung des Datenverkehrs innerhalb des paketorientierten Netzes erreicht, ein weiterer Vorteil ist, dass die insgesamt bereitzuhaltende Verarbeitungskapazität für die Umsetzung von digitalen Zeichen in Sprachsignale und umgekehrt geringer sein kann als bei einem Webserver, der in herkömmlicher Weise digitalisierte Sprachdaten empfängt und sendet. Wenn nämlich die Verarbeitung und Erzeugung von Sprachdaten in herkömmlicher Weise zentralisiert an einem VoiceXML-Skripten verarbeitenden Server stattfindet, und es mehrerer solche Server in einem Netzwerk gibt, so müsste die Rechenkapazität jedes einzelnen dieser Server, um jeder Situation gewachsen zu sein, theoretisch für alle Benutzer ausreichen, die gleichzeitig auf das Netz zugreifen können. Bei einer dezentralen Verarbeitung und Erzeugung der Sprachsignale an Telefonschnittstellen eines solchen Netzes genügt es, wenn die Rechenleistung an jeder Telefonschnittstelle für die maximale Zahl der dort anschließbaren Teilnehmer ausreicht. D. h. die Summe der Verarbeitungsleistungen der Telefonschnittstellen bei dezentraler Erzeugung und Verarbeitung gemäß der Erfindung entspricht der Verarbeitungsleistung, die in herkömmlicher Weise an jedem einzelnen Server vorzuhalten wäre. This will not only reduce traffic reached within the packet-oriented network, another The advantage is that the total to be kept ready Processing capacity for the conversion of digital characters into Speech signals and vice versa can be lower than in one Web server that digitized in a conventional manner Voice data receives and sends. If processing and Generation of speech data in a conventional manner centralized on a server processing VoiceXML scripts takes place, and there are several such servers in a network, so the computing capacity of each of these servers, to be up to any situation, theoretically for everyone Sufficient users who access the network at the same time can. With decentralized processing and generation of Voice signals on the telephone interfaces of such a network it is enough if the computing power at everyone Telephone interface for the maximum number of connectable there Participant is sufficient. I.e. the sum of the processing services of the Telephone interfaces for decentralized generation and Processing according to the invention corresponds to the Processing power in the conventional manner on each individual server would be available.
Der Programmcode ist vorzugsweise am Server in Hochsprache, insbesondere als VoiceXML-Skript, gespeichert, und die Telefonschnittstelle ist mit einer Übersetzungseinheit zum Übersetzen der Hochsprache in von einem Prozessor der Telefonschnittstelle ausführbare Instruktionen ausgestattet. The program code is preferably in high language on the server, especially saved as a VoiceXML script, and the Telephone interface is available with a translation unit Translating the high-level language into from a processor Telephone interface equipped with executable instructions.
Dies erleichtert die Verwendung unterschiedlicher Typen von Telefonschnittstellen an dem paketorientierten Netz. Der Hochsprachencode kann für alle diese Schnittstellen einheitlich abgefasst sein, eine Anpassung an die jeweiligen technischen Merkmale der Telefonschnittstelle findet jeweils beim Übersetzen des Codes in die von der Telefonschnittstelle ausführbaren Instruktionen statt. This makes it easier to use different types of Telephone interfaces on the packet-oriented network. The High-level language code can be used for all of these interfaces be composed uniformly, an adaptation to the respective technical features of the telephone interface take place at the Translate the code into that from the phone interface executable instructions instead.
Die Übersetzungseinheit umfasst vorzugsweise einen Interpreter, D. h. ein empfangener Programmcode wird nicht notwendigerweise vor Beginn seiner Ausführung an der Telefonschnittstelle vollständig in ausführbare Instruktionen übersetzt, sondern die Übersetzung findet zeitlich überlappend mit der Ausführung der Instruktionen statt. Codeabschnitte, die nicht ausgeführt werden, können unübersetzt bleiben. The translation unit preferably comprises one Interpreter, i.e. a received program code is not necessarily before starting execution on the Phone interface fully translated into executable instructions rather, the translation overlaps with the Execution of the instructions instead. Sections of code that are not can be left untranslated.
Weitere Merkmale und Vorteile der Erfindung ergeben sich aus der nachfolgenden Beschreibung eines Ausführungsbeispiels mit Bezug auf die beigefügte Zeichnung, die ein Blockdiagramm eines Systems für spracherzeugende oder -verarbeitende Telefonieanwendungen zeigt. Further features and advantages of the invention result from the following description of an embodiment with Reference to the accompanying drawing, which is a block diagram of a system for language producing or processing Shows telephony applications.
Das System gemäß Fig. 1 umfasst wenigstens einen Webserver WS1, an dem Code für spracherzeugende und/oder -verarbeitende Telefonieanwendungen in Form von VoiceXML-Skripten in einem ersten Speicher S1 gespeichert sind. Der Webserver WS1 ist mit einem IP-Netzwerk NW verbunden, über das die Inhalte des Speichers S1 abfragbar sind. Der Webserver WS1 kann in herkömmlicher Weise über die notwendigen Mittel verfügen, um die im Speicher S1 gespeicherten Skripten selbst abzuarbeiten und so anhand der Skripten erzeugte digitalisierte Sprachsignale an einen mit dem Netzwerk NW verbundenen - nicht dargestellten - Teilnehmer zu senden bzw. Sprachsignale von diesem zu empfangen, zu verarbeiten und in Abhängigkeit der Verarbeitungsergebnisse bestimmte Aktionen durchzuführen. Diese Fähigkeit ist im Rahmen der vorliegenden Erfindung allerdings nicht unbedingt erforderlich. The system according to FIG. 1 comprises at least one web server WS1, on which code for voice-producing and / or processing telephony applications in the form of VoiceXML scripts are stored in a first memory S1. The web server WS1 is connected to an IP network NW, via which the contents of the memory S1 can be queried. In a conventional manner, the web server WS1 can have the necessary means to process the scripts stored in the memory S1 itself and thus send digitized voice signals generated on the basis of the scripts to a subscriber (not shown) connected to the network NW or to send voice signals from the subscriber receive, process and perform certain actions depending on the processing results. However, this capability is not absolutely necessary in the context of the present invention.
Weitere Webserver WS2, WS3, . . . mit oder ohne Speicher für VoiceXML-Skripten können mit dem IP-Netzwerk NW verbunden sein. Other web servers WS2, WS3,. , , with or without memory for VoiceXML scripts can be connected to the IP network NW his.
Eine Telefonschnittstelle TI verbindet das IP-Netzwerk NW mit einem Telefonnetz TN. Über die Telefonschnittstelle TI können an das Telefonnetz TN angeschlossene Sprachendgeräte UE1, UE2 im Speicher S1 des Webserver WS1 hinterlegte VoiceXML-Inhalte abfragen und nutzen. Zu diesem Zweck umfasst die Telefonschnittstelle TI einen Prozessor P, ein S.100-Framework, dessen wesentlicher Bestandteil eine in einem zweiten Speicher S2 abgelegte Bibliothek von Funktionen zur Spracherzeugung und -verarbeitung nach dem S.100-Standard ist, sowie eine Übersetzungseinheit TU, die einen Parser PA und einen Interpreter IN für VoiceXML-Skripten umfasst. A telephone interface TI connects the IP network NW to a telephone network TN. Using the TI telephone interface Voice terminals UE1, UE2 connected to the telephone network TN VoiceXML contents stored in memory S1 of the web server WS1 query and use. For this purpose, the Telephone interface TI a processor P, an S.100 framework, the essential part of which is in a second memory S2 filed library of functions for language generation and processing according to the S.100 standard, as well as a Translation unit TU, a parser PA and a Interpreter IN for VoiceXML scripts includes.
Wenn ein Sprachendgerät UE1, UE2 über das Telefonnetz TN auf ein am Webserver WS1 abgelegtes VoiceXML-Skript zugreift, um eine darin verkörperte Anwendung zu nutzen, so wird das entsprechende Skript aus dem Speicher S1 gelesen und über das Netzwerk NW an die Telefonschnittstelle TI übertragen, um von deren Prozessor P abgearbeitet zu werden. Zu diesem Zweck analysiert zunächst der Parser PA der Übersetzungseinheit TU die Syntaxstruktur des Skripts, identifiziert darin enthaltene Befehle und Parameter sowie Ausgangs- und Zielpunkte von Verzweigungen. Der Interpreter IN übersetzt jeweils einen einzelnen der so identifizierten Befehle in vom Prozessor P ausführbare Instruktionen, wobei er zur Spracherzeugung und -verarbeitung auf die im Speicher S2 enthaltene S.100-Bibliothek zurückgreift. Bezeichnungen und Parameter dieser Funktionen sind standardisiert; ihr Code kann gerätespezifisch auf die Hardware jeder einzelnen Telefonschnittstelle TI zugeschnitten sein, so dass die im Speicher S1 enthaltenen Skripte von allen an das Netzwerk NW angeschlossenen Telefonschnittstellen TI unabhängig von ihrer spezifischen Hardware- Konfiguration ausführbar sind. When a voice terminal UE1, UE2 on the telephone network TN accesses a VoiceXML script stored on the WS1 web server in order to to use an application embodied in it, it will corresponding script read from memory S1 and via the Network NW transmitted to the telephone interface TI in order to their processor P to be processed. To this end The parser PA of the translation unit TU first analyzes the syntax structure of the script, identified in it included commands and parameters as well as starting and target points of Branches. The interpreter IN translates one at a time individual of the commands identified in this way by the processor P executable instructions, including language generation and processing to that contained in memory S2 P.100 library. Terms and parameters of this Functions are standardized; your code can be device-specific the hardware of each individual telephone interface TI be tailored so that those contained in memory S1 Scripts from everyone connected to the NW network Telephone interfaces TI regardless of their specific hardware Configuration are executable.
Das erfindungsgemäße System kann zum einen genutzt werden, um für einen Benutzer an einem Sprachendgerät UE1, UE2 VoiceXMLbasierende Web-Inhalte nutzbar zu machen, indem der Benutzer mit Hilfe seines Sprachendgerätes UE2, z. B. Arbeitsplatzrechners, der mit Mikrofon und Lautsprecher, hier in Form eines Headsets dargestellt, ausgestattet ist, eine Internetverbindung zum Webserver WS1 aufbaut und dort Seiten aufruft, die VoiceXML verwenden. The system according to the invention can be used on the one hand to for a user on a voice terminal UE1, UE2 Make VoiceXML-based web content usable by the user with the help of his voice terminal UE2, z. B. Workstation, the one with microphone and loudspeaker, here in the form of a Headsets shown, equipped, one Establishes an Internet connection to the WS1 web server and there calls pages that Use VoiceXML.
Das System kann aber auch mit Hilfe eines Sprachendgerätes UE1 wie etwa eines einfachen Telefons genutzt werden, das keinen Datenverkehr, sondern lediglich Sprachkommunikation unterstützt. So ist gemäß einer bevorzugten Ausgestaltung der Erfindung die Telefonschnittstelle TI des IP-Netzwerks NW eine Nebenstellenanlage, die mit einer Mehrzahl von Endgeräten über Telefonleitungen verbindbar ist und in der Lage ist, mit einem paketorientierten Netz wie etwa dem Internet - ggf. unter transparenter Zwischenschaltung eines öffentlichen Fernmeldenetzes - zu kommunizieren. Um mit einer solchen Nebenstellenanlage auf dem Webserver WS1 hinterlegte VoiceXML- Inhalte zu nutzen, genügt es, wenigstens einem VoiceXML- Skript auf dem Webserver WSl eine vom Endgerät wählbare Rufnummer derart zuzuordnen, dass die Nebenstellenanlage, wenn diese Nummer an einem Endgerät gewählt wird, das entsprechende Skript, hier als Boot-Skript bezeichnet, vom Webserver WSl lädt und ausführt. Dieses Boot-Skript kann z. B. ein Auswahlmenü implementieren, dessen Auswahloptionen dem Benutzer von der Nebenstellenanlage vorgesprochen werden und zwischen denen er durch Sprechen eines entsprechenden Befehls eine Auswahl treffen kann. Wenn es sich bei den Auswahloptionen wiederum um vom Webserver WS1 abrufbare VoiceXML-Skripten einzelner Anwendungen oder weitere Auswahlskripten handelt, kann der Benutzer in dieser Weise auf eine große Zahl unterschiedlicher spracherzeugender und/oder -verarbeitender Anwendungen zugreifen. The system can also with the help of a voice terminal UE1 can be used such as a simple telephone that no data traffic, just voice communication supported. According to a preferred embodiment, the Invention the telephone interface TI of the IP network NW a private branch exchange with a plurality of terminals is connectable via telephone lines and is able to a packet-oriented network such as the Internet - possibly with the transparent interposition of a public Telecommunications network - to communicate. To with such Private branch exchange on the WS1 web server VoiceXML- To use content, it is sufficient to have at least one VoiceXML Script on the web server WSl selectable from the terminal Allocate the number so that the private branch exchange, if this number is dialed on a terminal that corresponding script, referred to here as a boot script, from the web server WSl loads and executes. This boot script can e.g. B. a Implement selection menu, the selection options of which the user of be auditioned to the private branch exchange and between to whom he issued a command by issuing a corresponding command Can make a selection. If it were the selection options again VoiceXML scripts that can be called up from the WS1 web server individual applications or other selection scripts the user in this way to a large number different language producing and / or processing applications access.
Da das Boot-Skript bei jedem Zugriff auf spracherzeugende und/oder verarbeitende Skripten benötigt wird, kann es auch durch ein dauerhaft an der Nebenstellenanlage gespeichertes Programm mit der gleichen Funktion ersetzt werden, und erst vom Benutzer durch Sprechen diesbezüglicher Befehle ausgewählte Skripten werden vom Webserver WS1 heruntergeladen. Because the boot script each time you access language-generating and / or processing scripts is required, it can also by a permanently saved on the private branch exchange Program to be replaced with the same function, and only from the user by speaking related commands selected scripts are downloaded from the WS1 web server.
Die von diesen Skripten verkörperten spracherzeugenden oder -verarbeitenden Anwendungen können unterschiedlichster Art sein und können mit den herkömmlichen Funktionen einer Nebenstellenanlage verwandt sein, müssen es aber nicht. Ein solches Skript kann z. B. einen automatischen Ansagedienst implementieren, der einem Anrufer, der die Nebenstellenanlage über ein öffentliches Netz anruft, eine Reihe von Dienstleistungen einer Firma, die die Nebenstellenanlage unterhält, wie etwa Kundendienst, Verkauf, technische Beratung etc. ansagt und den Anrufer in Abhängigkeit von einer von ihm gesprochenen Auswahl mit einer geeigneten Nebenstelle verbindet. Denkbar ist aber auch der Einsatz für Anwendungen, die mit der herkömmlichen Aufgabe einer Nebenstellenanlage nur wenig zu tun haben, z. B. bei e-Commerce-Lösungen, wo die durch ein geeignetes vom Webserver WS1 auf die Nebenstellenanlage geladenes Skript gesteuerte Sprachverarbeitungsfähigkeit genutzt werden kann, um von einem Benutzer gesprochene Wörter in Bestellnummern, Stückzahlen, Artikelbezeichnungen usw. in Form von Zeichenketten umzuwandeln, welche dann zur weiteren Verarbeitung als Bestellung an den Webserver WS1 übermittelt werden. The language generating or embodied by these scripts processing applications can be of various types and can be one with the conventional functions PBX, but need not be. On such a script can e.g. B. an automatic announcement service implement that of a caller who has the private branch exchange over a public network calls a number of services a company that maintains the private branch exchange, such as Customer service, sales, technical advice etc. announces and the caller depending on one spoken by him Connects selection with a suitable extension. Conceivable is also the use for applications with the conventional job of a private branch exchange to do little have, e.g. B. in e-commerce solutions, where through a suitable one loaded from the web server WS1 onto the private branch exchange Script-controlled language processing capabilities can be used can turn words spoken by a user into Order numbers, quantities, article descriptions etc. in the form of Convert strings, which then for further processing transmitted to the WS1 web server as an order.
Claims (7)
mit einem paketorientierten Datennetz (NW),
einem Server (WS1), der Teil des paketorientierten Datennetzes (NW) ist und einen Speicher (S1) für Programmcode der Telefonieanwendungen umfasst,
einer Telefonschnittstelle (TI) zum Verbinden des Datennetzes (NW) mit wenigstens einer Telefonleitung und Mitteln zum Umsetzen von über die Telefonleitung empfangenen Sprachsignalen in digitale Zeichen und von digitalen Zeichen in Sprachsignale zur Ausgabe über die Telefonleitung,
dadurch gekennzeichnet,
dass die Umsetzungsmittel unter der Kontrolle der programmgesteuerten Telefonschnittstelle (TI) arbeiten, und
dass die Telefonschnittstelle (TI) eingerichtet ist, Programmcode zum Steuern der Umsetzungsmittel vom Server (WS1) über das paketorientierte Datennetz (NW) zu empfangen. 1. system for voice generating and / or processing telephony applications,
with a packet-oriented data network (NW),
a server (WS1) which is part of the packet-oriented data network (NW) and comprises a memory (S1) for program code of the telephony applications,
a telephone interface (TI) for connecting the data network (NW) to at least one telephone line and means for converting voice signals received via the telephone line into digital characters and from digital characters into voice signals for output via the telephone line,
characterized by
that the implementation means operate under the control of the program-controlled telephone interface (TI), and
that the telephone interface (TI) is set up to receive program code for controlling the implementation means from the server (WS1) via the packet-oriented data network (NW).
mit wenigstens einem Anschluss für eine Telefonleitung und wenigstens einem Anschluss für die Kommunikation mit einem paketorientierten Datennetz (NW),
mit Mitteln zum Umsetzen von über die Telefonleitung empfangenen Sprachsignalen in digitale Zeichen und von digitalen Zeichen in Sprachsignale zur Ausgabe über die Telefonleitung,
dadurch gekennzeichnet,
dass sie eingerichtet ist, Programmcode zum Steuern der Umsetzungsmittel vom Server (WS1) über das paketorientierte Datennetz (NW) zu empfangen 2. Telephone interface (TI) for a system according to claim 1,
with at least one connection for a telephone line and at least one connection for communication with a packet-oriented data network (NW),
with means for converting voice signals received via the telephone line into digital characters and from digital characters into voice signals for output via the telephone line,
characterized,
that it is set up to receive program code for controlling the implementation means from the server (WS1) via the packet-oriented data network (NW)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE10148604A DE10148604A1 (en) | 2001-10-02 | 2001-10-02 | System for speech-generating/processing applications in telephony has devices to convert voice signals received via telephone lines into digital signals and digital signals into voice signals to be sent over the telephone lines. |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE10148604A DE10148604A1 (en) | 2001-10-02 | 2001-10-02 | System for speech-generating/processing applications in telephony has devices to convert voice signals received via telephone lines into digital signals and digital signals into voice signals to be sent over the telephone lines. |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE10148604A1 true DE10148604A1 (en) | 2003-04-24 |
Family
ID=7701126
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE10148604A Withdrawn DE10148604A1 (en) | 2001-10-02 | 2001-10-02 | System for speech-generating/processing applications in telephony has devices to convert voice signals received via telephone lines into digital signals and digital signals into voice signals to be sent over the telephone lines. |
Country Status (1)
| Country | Link |
|---|---|
| DE (1) | DE10148604A1 (en) |
-
2001
- 2001-10-02 DE DE10148604A patent/DE10148604A1/en not_active Withdrawn
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69814181T2 (en) | METHOD AND DEVICE FOR CONFIGURING A VOICE RECOGNITION SYSTEM | |
| DE10208295A1 (en) | Method for operating a voice dialog system | |
| EP1454464B1 (en) | System for converting text data into speech output | |
| EP1982508B1 (en) | Device and method for the creation of a voice browser functionality | |
| DE10118125A1 (en) | Automatic purchasing system for use with user terminal includes user dialogue system with automatic speech recognition device and speech delivery device | |
| DE10148604A1 (en) | System for speech-generating/processing applications in telephony has devices to convert voice signals received via telephone lines into digital signals and digital signals into voice signals to be sent over the telephone lines. | |
| DE19741473C2 (en) | Method for controlling display user interfaces of system-controlled devices in a communication system | |
| DE10129322A1 (en) | Central administration of a call center | |
| DE19542724A1 (en) | ISDN terminal with a data interface | |
| EP2196011B1 (en) | Method and communications arrangement for operating a communications connection | |
| EP1150479A2 (en) | Method for interactive query of information by means of a mobile telephone | |
| EP2822261A2 (en) | Method and assembly for pooling multimodal waiting fields and searching current telephone calls for a user in a telecommunications network | |
| EP1404096B1 (en) | Method and communication device for collecting information from call centers distributed in several exchanges of a telecommunication network | |
| DE10138102A1 (en) | Telephone conference system has arrangement for accessing subscriber data in memory by entering voice terminal dependent shortcut code for relevant subscriber(s) at voice terminal | |
| WO1999007130A1 (en) | Method for processing and/or querying line-relevant data of a subscriber line | |
| DE19920692B4 (en) | Communication system and method | |
| WO2002028112A1 (en) | Method and gateway device for converting a feature control signaling when changing between different communications networks | |
| EP1282293A1 (en) | Method and apparatus for treatment of calls in a telecommunication network and its related units | |
| WO2003073710A1 (en) | Open modular portal architecture | |
| DE19948090B4 (en) | Method for connecting a terminal to a telecommunications system and associated electronic components | |
| EP0866594A2 (en) | Communication system, especially program controlled private communication system in which a timetable function is realised | |
| DE202012103659U1 (en) | telecommunications equipment | |
| DE10200855A1 (en) | Method and system for the dynamic generation of announcement content | |
| DE10124823A1 (en) | Process for handling audio files in telecommunications equipment and associated telecommunications equipment | |
| DE10240899A1 (en) | Data transmission service subscriber unit for speech and video data has separate signalling unit and handheld units with different operating systems |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| OP8 | Request for examination as to paragraph 44 patent law | ||
| 8130 | Withdrawal |