[go: up one dir, main page]

DE102004014414A1 - Method for speaker identification for telecommunication network, involves ascertaining data on the identity of a person characterized by a search profile - Google Patents

Method for speaker identification for telecommunication network, involves ascertaining data on the identity of a person characterized by a search profile Download PDF

Info

Publication number
DE102004014414A1
DE102004014414A1 DE200410014414 DE102004014414A DE102004014414A1 DE 102004014414 A1 DE102004014414 A1 DE 102004014414A1 DE 200410014414 DE200410014414 DE 200410014414 DE 102004014414 A DE102004014414 A DE 102004014414A DE 102004014414 A1 DE102004014414 A1 DE 102004014414A1
Authority
DE
Germany
Prior art keywords
data
search
speaker
recognition
person
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE200410014414
Other languages
German (de)
Inventor
Marian Trinkel
Christel Müller
Fred Runge
Heiko Armin Schneider
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deutsche Telekom AG
Original Assignee
Deutsche Telekom AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deutsche Telekom AG filed Critical Deutsche Telekom AG
Priority to DE200410014414 priority Critical patent/DE102004014414A1/en
Publication of DE102004014414A1 publication Critical patent/DE102004014414A1/en
Ceased legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2854Wide area networks, e.g. public data networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

A method for speaker identification uses an identification system based on verbal information which is linked to a knowledge-based system in which by means of a search routine, preferably via a search-engine from a publicly accessible data-bank (7) and/or at least one internal customer data bank on the basis of person-related search profile installed in the search routine, data on the identity of the person characterized by the search profile is ascertained and from the data ascertained for the person, suitable data is extracted via a filter function for the speaker recognition enquiry, which is defined as an answer for the speaker identification process. Data suitable as a answer for the identification process is automatically stored for speaker verification together with the answers. An independent claim is included for a system for knowledge-based speaker identification.

Description

Die Erfindung bezieht sich auf ein System zur wissensbasierten Sprechererkennung, und betrifft insbesondere die sprachgesteuerte Sprechererkennung von Kommunikationsteilnehmern nach dem Oberbegriff des 1. Patentanspruches. Bekannt ist es, einen Telekommunikationsanschlusses über die in verschiedenen Telekommunikationsnetzen übermittelte Anschlusskennung CLI (Calling Line Identification), ANI (Automatic Number Identification), IP-Adresse (Internet Protokoll Adresse) oder HLR (Home Location Register) zu identifizieren.The The invention relates to a system for knowledge-based speaker recognition, and in particular relates to voice-controlled speaker recognition of communication participants according to the preamble of the first claim. It is known, a telecommunications connection over the in different telecommunication networks transmitted connection identifier CLI (Calling Line Identification), ANI (Automatic Number Identification), IP Address (Internet Protocol Address) or HLR (Home Location Register).

Die Unterscheidung der einzelnen Nutzer eines Telekommunikationsanschlusses ist durch Abfrage einer personengebundenen Kennung, wie beispielsweise einer PIN, möglich. Die PIN (Personal Identification Number) ist dabei eine persönliche Geheimnummer, mit der sich ein Nutzer gegenüber einem System ausweist. Weiterhin sind Spracherkennungssystemen und Sprechererkennungssysteme bekannt. Bei den Spracherkennungssystemen wird der Inhalt einer gesprochenen Äußerung erkannt. Die allgemein bekannten Spracherkennungssysteme beruhen auf der Grundlage von Spracherkennungsalgorithmen, wie beispielsweise der Systemlieferanten nuance communications, und Temic, die eine größere Anzahl von Wörtern in Echtzeit erkennen können.The Distinction of individual users of a telecommunications connection is by querying a personal identifier, such as a PIN, possible. The PIN (Personal Identification Number) is a personal PIN number, with which a user faces identifies a system. Furthermore, speech recognition systems and Speaker recognition systems known. In the speech recognition systems the content of a spoken utterance is recognized. The general known speech recognition systems are based on Speech recognition algorithms, such as the system supplier nuance communications, and Temic, which has a larger number of words in it Real time can detect.

Werden derartige Algorithmen für die sprachgesteuerte Bedienung, beispielsweise der Funktionen eines Telekommunikationsendgerätes, verwendet, besteht das Problem der Erkennung/Identifizierung eines konkreten Nutzers. Dieses Problem wird durch Sprechererkennungssysteme gelöst. Zu dieser Gruppe gehören insbesondere Sprecherverifikationssysteme. Bei Sprecherverifikationssystemen wird die von einer Person behauptete Identität durch Analyse eines Musters der Stimme dieser Person geprüft. Das Prinzip der Sprecherverifikation beruht auf der Annahme, dass jede Person eindeutig durch ihre Stimme identifiziert werden kann. Der Sicherheitsstandard einer derartigen Lösung hängt davon ab, wie gut der Verifikationsalgorithmus die Stimme eines autorisierten Nutzers von allen nicht autorisierten Nutzern unterscheiden kann.Become such algorithms for the voice-controlled operation, for example the functions of a Telecommunications terminal, used, there is the problem of detection / identification of a concrete user. This problem is caused by speaker recognition systems solved. Belong to this group in particular speaker verification systems. For speaker verification systems becomes the identity asserted by a person by analyzing a pattern the voice of this person tested. The principle of speaker verification is based on the assumption that each person can be uniquely identified by their vote. The security standard of such a solution depends on how well the verification algorithm the voice of an authorized user of all unauthorized users can differentiate.

Dieses Prinzip erfordert jedoch erhebliche Investitionen in Zeit und Aufwand zur Durchführung eines bei diesem Lösungsansatz erforderlichen Trainingsprozesses des betreffenden Sprecherverifikationssystems.This Principle, however, requires considerable investment in time and effort to carry out a in this approach necessary training process of the relevant speaker verification system.

Ein weiterer bekannter Lösungsansatz zur Feststellung der Identität einer Person beruht auf der Technik der Verifikation mittels verbaler Informationen. Dabei handelt es sich um Informationen, die nur dem zu verifizierenden Teilnehmer selber bekannt sind und deren Inhalt bezüglich Frage und Antwort zwischen dem Dienstanbieter und dem zu verifizierenden Teilnehmer in einem der eigentlichen Verifikation vorgelagerten Prozess festgelegt wurde. Das kann beispielsweise ein persönlicher Legitimationssatz, eine PIN, ein Geburtsort, ein Geburtsname oder eine Wohnadresse sein.One another known approach for establishing the identity a person relies on the technique of verification by means of verbal Information. This is information that only the to be verified participants themselves are known and their content in terms of Question and answer between the service provider and the one to verify Participants in one of the actual verification upstream Process has been set. For example, this can be a personal one Legitimacy phrase, PIN, birthplace, birth name, or one Be home address.

So ist beispielsweise aus DE 195 27 022 C2 ein Verfahren zur Authentisierung von Dienste-Benutzern, insbesondere zur Authentisierung von Benutzern eines Sprach-Mehrwertdienst Virtual Card Calling (VCC), und Authentisierungskarte dazu bekannt, bei dem für jeden Dienste-Benutzer eine benutzerindividuell festgelegte Informationsmenge, bestehend aus einer Abfragemenge und einer Menge von zugehörigen Antworten, gespeichert wird. Aus der Abfragemenge werden eine oder mehrere Fragen ausgewählt und dem Benutzer zur Beantwortung zugesendet. Nur bei Übereinstimmung der vom Kunden eingegebenen Antworten mit den jeweiligen zentral zu den Fragen gespeicherten Antworten, wird dem Benutzer der Zugang zu dem gewünschten Dienst freigegeben. Dieser Lösung liegt eine aus Fragen und den dazugehörenden Antworten bestehend, in sich geschlossene Informationsmenge zugrunde, die vorab mit dem Benutzer abgestimmt wurde.For example, this is off DE 195 27 022 C2 a method for authenticating service users, in particular for authenticating users of a voice value-added service Virtual Card Calling (VCC), and the authentication card being known, wherein for each service user a user-defined set of information consisting of a query amount and a set of associated answers, is stored. One or more questions are selected from the query set and sent to the user for answering. Only if the answers entered by the customer match the respective answers stored centrally to the questions, the user is granted access to the desired service. This solution is based on a set of questions and the associated answers, self-contained amount of information, which was previously agreed with the user.

DE 698 00 320 T2 beschreibt ein Verfahren und eine Vorrichtung zur Sprechererkennung durch Prüfung von mündlicher Information mittels Zwangsdekodierung. Diese Lösung basiert ebenfalls auf der Prüfung des verbalen Informationsgehaltes, welcher in einer vom Sprecher abgegebenen Äußerung enthalten ist. Die Sprechererkennung erfolgt dabei auf der Grundlage einer forcierten Decodierung der gesprochenen Äußerung, die auf einem speziellen Legitimierungssatz beruht, welcher einem vorgegebenen Sprecher zugeordnet ist. Bei dieser Lösung wird ebenfalls auf einen bereits mit dem Nutzer abgesprochenen Text zurückgegriffen. DE 698 00 320 T2 describes a method and a device for speaker recognition by checking verbal information by means of forced decoding. This solution is also based on checking the verbal information content contained in an utterance given by the speaker. The speaker recognition takes place on the basis of a forced decoding of the spoken utterance, which is based on a special legitimization sentence which is assigned to a given speaker. This solution also makes use of text already agreed with the user.

In DE 698 14 195 T2 wird eine Vorrichtung zur Sprechererkennung bzw. ein Sprechererkennungsverfahren beschrieben, bei dem die Sprechererkennung auf der Abfrage einer Kennung, eines vorabgestimmten Textes und eines Kennwortes vom zu verifizierenden Teilnehmer erfolgt.In DE 698 14 195 T2 a device for speaker recognition or a speaker recognition method is described, in which the speaker recognition is carried out on the query of an identifier, a pre-coordinated text and a password from the participant to be verified.

Bei allen beschriebenen Lösungen beruht der Sprechererkennungsprozess immer auf Daten, die in einem vorgelagerten Verfahrensschritt mit dem Kunden bereits abgestimmt wurden. Die Festlegung der während eines Sprechererkennungsprozesses in Form von Fragen und Antworten auszutauschenden Dateninhalte geschieht zumeist bereits während der Registrierung eines Kunden bei einem Diensteanbieter/Provider, wobei dem Kunden während des Registrierungsprozesses Fragen vom System gestellt werden, die er beantworten muss. Die Fragen und die dazugehörenden Antworten bilden die Daten, die später zur Identifikation des Kunden herangezogen werden. Es handelt sich dabei also in jedem Fall immer um eine in sich geschlossenen Datemmenge. Durch diese Datenmenge ist der Umfang der Abfragemöglichkeiten von vorne herein fest begrenzt.In all the solutions described, the speaker recognition process always relies on data that has already been agreed with the customer in an upstream process step. The specification of the data contents to be exchanged during a speaker recognition process in the form of questions and answers usually already takes place during the registration of a customer with a service provider / provider, whereby the customer is asked questions by the system during the registration process the one he has to answer. The questions and the associated answers form the data that will later be used to identify the customer. In any case, this is always a self-contained set of data. This amount of data limits the scope of the query options from the outset.

Bei Lösungen, die auf diesem Prinzip beruhen, ist der Sprechererkennungsprozess immer im Rahmen eines ja/nein Abfrageschema mit einem vorab zwischen den Vertragspartnern festgelegten Informationsinhalt konzipiert. Diese Lösung sind zumeist sehr aufwendig und zudem auch wenig flexibel, insbesondere in der Mensch-Maschine-Beziehung.at Solutions, based on this principle is the speaker recognition process always in the context of a yes / no query scheme with an advance between The information content of the contract partners is designed. This solution are usually very expensive and also not very flexible, in particular in the human-machine relationship.

Aufgabe der Erfindung ist es insbesondere den Sprechererkennungsprozess flexibler zu gestalten. Dabei soll sowohl der Aufwand für den Dienstanbieter/Provider, der die Zugangsberechtigung zu seinen Datenbanken bzw. Dienstangeboten über Sprechererkennungssysteme regelt, als auch der Aufwand für den Kunden in Bezug zum Mensch-Maschine-Interface, in den dem eigentlichen Sprechererkennungsprozess vorgelagerten Stufen automatisiert, vereinfacht und systemtechnisch verbessert werden.task In particular, the invention is the speaker recognition process more flexible. In this case, both the effort for the service provider / provider, the access authorization to its databases or service offers via speaker recognition systems regulates, as well as the effort for the customer in relation to the man-machine interface, in the actual Speaker recognition process upstream stages automated, simplified and systemically improved.

Die Lösung ist darauf ausgerichtet, die durch die starre Abfrage von voreingegebenen Daten wenig flexiblen Sprechererkennungsprozesse aufzubrechen und durch ein wesentlich flexibleres, quasi offenes Sprechererkennungssystem zu ersetzen.The solution is designed to be pre-set by the rigid query Data to break up little flexible speaker recognition processes and through a much more flexible, quasi-open speaker recognition system to replace.

Ausgangspunkt der Erfindung ist die Tatsache, dass persönliche Kundendaten oder personenbezogene Daten in einer Vielzahl von Datenbanken vorhanden sind. Dabei kann es sich sowohl um über das Internet öffentlich zugängliche Datenbanken 7, als auch interne Kundendatenbanken 4 von Dienstleistern handeln, die nur dem Dienstleister selber zugänglich sind. Das Wirkprinzip der Erfindung beruht darauf, die in internen Kundendatenbanken 4 und/oder öffentlich zugänglichen Datenbanken 7 vorhandenen Daten zu Personen für die Generierung von Erkennungsdialogen heranzuziehen, wobei die betreffende Person selber nicht in den Generierungsprozess der Erkennungsdialoge einbezogen wird. Die in öffentlichen Datenbanken 7 zu einer Person vorhandene Daten, bei denen es sich beispielsweise um Daten zur Person selber oder um Daten aus dem persönlichen Umfeld der Zielperson handeln kann, gehen zumeist in dem immensen Umfang der in Datenbanken üblicherweise vorhandenen Datenmenge unter. Sie sind also von einem Dritten nicht so ohne weiteres zu ermitteln. Das trifft insbesondere auch auf Informationen zu einer Person zu, die nicht direkt vorliegen, sondern die sich aus dem Sinngehalt der Information ergeben. Die Sicherheit bei der Abfrage von Daten, die öffentlich zugänglich sind, ergibt sich daraus, dass aus einer Vielzahl von Daten nur einige wenige Daten für die Generierung von Sprechererkennungsdialogen herangezogen und in entsprechenden Sprecherdatenbanken 12 abgespeichert werden, und dass von den in den Sprecherdatenbanken 12 gespeicherten Sprechererkennungsdialogen im Rahmen einer Sprechererkennungsanfrage nur einige Sprechererkennungsdialoge nach dem Zufallsprinzip und/oder einer Gewichtung, für die Sprechererkennung herangezogen werden.The starting point of the invention is the fact that personal customer data or personal data are present in a large number of databases. These can be both publicly accessible databases via the Internet 7 , as well as internal customer databases 4 of service providers who are only accessible to the service provider themselves. The principle of the invention is based on that in internal customer databases 4 and / or publicly accessible databases 7 to use existing data on persons for the generation of recognition dialogues, whereby the person in question is not involved in the generation process of the recognition dialogues. The in public databases 7 Data available to a person, which can be, for example, personal data or data from the personal environment of the target person, are usually lost in the immense amount of data that is usually available in databases. So you are not so easily determined by a third party. This applies in particular to information about a person that is not directly available, but that results from the meaning of the information. The security of retrieving data that is publicly available results from the fact that only a few data from a large number of data are used for the generation of speaker recognition dialogues and in corresponding speaker databases 12 and that of those in the speaker databases 12 stored speaker recognition dialogues in the context of a speaker recognition request only a few speaker recognition dialogues according to the random principle and / or a weighting, are used for the speaker recognition.

Bei der Verwendung von Daten, die aus nicht öffentlichen Datenbanken, beispielsweise aus internen Kundendatenbanken 4 von Dienstleistern/Providern, stammen, ist die für die Sprechererkennung notwendige Sicherheit höher als bei Daten, die aus öffentlich zugänglichen Datenbanken 7 entnommen werden.When using data that comes from non-public databases, such as internal customer databases 4 from service providers / providers, the security required for speaker recognition is higher than for data coming from publicly accessible databases 7 be removed.

Die in den internen Kundendatenbanken 4 gespeicherten Kundendaten werden daher insbesondere für die Erstellung eines personenbezogenen Suchprofils herangezogen, auf dessen Basis über eine Suchroutine 13 die Suchanfrage nach für die Verifikation geeigneten Daten, z. B. im Internet, erfolgt.The in the internal customer databases 4 stored customer data are therefore used in particular for the creation of a personal search profile, based on a search routine 13 the search query for data suitable for verification, eg. B. on the Internet, takes place.

Es können jedoch auch durchaus Daten aus internen Kundendatenbanken 4 eines Dienstanbieters, die für die automatische Erstellung von Sprechererkennungsdialogen geeignet sind, in den automatischen Suchprozess einbezogen werden. Dabei kann es sich beispielsweise auch um nicht öffentliche Datenbanken des Dienstanbieters handeln, in denen Abrechnungsdaten über die durch den Kunden in Anspruch genommenen Dienstleistungen gespeichert werden. Das bietet sich hier besonders an, da in diesen Datenbanken eine eindeutige Zuordnung und Kennzeichnung des Kunden und des vom Kunden benutzten Endgerätes zu den Abrechnungsdaten zwangsläufig gegeben ist.However, it is also possible for data from internal customer databases 4 of a service provider that are suitable for the automatic generation of speaker recognition dialogues to be included in the automatic search process. This can also be, for example, non-public databases of the service provider, in which billing data on the services used by the customer are stored. This is particularly useful here, as in these databases a clear assignment and identification of the customer and the terminal used by the customer to the billing data is inevitably given.

In diesem Zusammenhang ist es weiterhin vorteilhaft, die Summe der im Rahmen einer Sprechererkennungsanfrage für die Identifikation notwendigen Sprechererkennungsdialoge in einem durch die Sicherheitsanforderungen bestimmten Verhältnis, sowohl aus öffentlich zugänglichen Datenbanken 7, als auch aus internen Kundendatenbanken 4 zu generieren.In this connection, it is furthermore advantageous to have the sum of the speaker recognition dialogs required for the identification within the scope of a speaker recognition request in a ratio determined by the security requirements, both from publicly accessible databases 7 , as well as from internal customer databases 4 to generate.

Der Prozess für die Bereitstellung der Daten für den Sprechererkennungsprozess lässt sich in drei Stufen unterteilen.

  • 1. Ermittlung des Suchprofils und Suche nach Kundendaten, die als Antwort auf eine Frage geeignet sind.
  • 2. Generierung der Fragen zu den als Antwort geeigneten Daten.
  • 3. Auswahl der dem Kunden zu stellenden Fragen.
The process for providing the data for the speaker recognition process can be divided into three stages.
  • 1. Identify the search profile and search for customer data that is appropriate in response to a question.
  • 2. Generation of questions about the answerable data.
  • 3. Selection of questions to be asked to the customer.

In der ersten Stufe wird automatisch eine Suchroutine 13 generiert, der ein Suchprofil/Suchschlüssel zugrunde liegt, das/der Identitätsangaben zur der zu verifizierenden Person enthält.In the first stage automatically a search routine 13 which is based on a search profile / search key containing identity information about the person to be verified.

Nachdem der Kunde eine Portalrufnummer/Adresse des Dienstanbieters angerufen hat, wird die Anschlusskennung seines Kundenendgerätes 1 ermittelt (Z.B. CLI, HLR, ANI, IP-Adresse). Anhand der Anschlusskennung werden beispielsweise über interne Kundendatenbanken 4 Daten ermittelt, die geeignet sind, den Kunden zu identifizieren, dem das Kundenendgerät 1 zugeordnet ist, z.B. durch die Zuordnung der Rufnummer (CLI, HRL) zu den dazugehörigem Kundendaten, wie Name, Vorname und Daten aus Adressanschrift, wie Hausnummmer, Straße, Ort, und Land.After the customer has called a portal number / address of the service provider, the connection ID of his customer terminal 1 determined (eg CLI, HLR, ANI, IP address). Using the connection identifier, for example, via internal customer databases 4 Identifies data that is suitable for identifying the customer to whom the customer terminal 1 is assigned, for example, by assigning the phone number (CLI, HRL) to the associated customer data, such as name, first name and data address from address, such as house number, street, city, and country.

Somit erhält man beispielsweise eine Zuordnung mit der Satzbeschreibung:
< Telekommunikationsanschlusskennung> <Daten> bzw.
<Rufnummer><Name><Vorname><Land><Straße><Hausnummer>
Thus, for example, an assignment with the sentence description is obtained:
<Telecommunications connection identifier><data> or
<Number><name><firstname><country><street><number>

Der aus diesen Daten generierte Suchschlüssel ergibt sich aus der Zuordnung entsprechend der Satzbeschreibung <Daten> oder Teile davon <Name, Vorname>. Die Suchroutine 13 ist zur Ermittlung von Daten ausgelegt, die sich auf die durch das Suchprofil definierte Person beziehen. Mittels der Suchroutine 13 werden über eine geeignete externe Suchmaschine 6, z. B. über das Internet, aus öffentlich zugänglichen Datenbanken 7 personenbezogene Daten, die der durch das Suchprofil definierten Person zuzuordnen sind, ermittelt. Es ist aber auch möglich, das die Suchroutine 13 in Verbindung mit dem Suchschlüssel selber die Aufgaben einer Suchmaschine 6 übernimmt.The search key generated from this data results from the assignment according to the sentence description <data> or parts thereof <name, first name>. The search routine 13 is designed to identify data related to the person defined by the search profile. Using the search routine 13 be through a suitable external search engine 6 , z. Via the Internet, from publicly accessible databases 7 personal data that can be assigned to the person defined by the search profile. But it is also possible that the search routine 13 in conjunction with the search key itself the tasks of a search engine 6 takes over.

Mit der Suchroutine 13 kann gleichzeitig auch eine Suche in den nicht öffentlichen Datenbanken des betreffenden Dienstanbieters erfolgen, wobei diese Suche über gesicherte Verbindungen erfolgt.With the search routine 13 At the same time, a search in the non-public databases of the relevant service provider can take place, whereby this search takes place via secure connections.

Die im Rahmen des Suchvorganges zum Kunden ermittelten Daten werden beispielsweise nach bestimmten Begriffen, oder auch Schlagworten oder nach Zahlenangaben durchsucht, die sich direkt auf die Person des Kunden oder auf Informationen aus dem Umfeld des Kunden beziehen. Die Suche wird vorzugsweise mit Hilfe von Werkzeugen des Wissensmanagements, wie beispielsweise Wissens-Filterfunktionen vorgenommen, die geeignet sind, Daten automatisch zu klassifizieren. Die automatische Klassifikation kann dabei mittels statistischer Verfahren, linguistischer Verfahren, Ursache-Wirkungs-Verfahren, oder auch mittels logisch/linguistisch/semantisch unabhängiger Klassenschemata vorgenommen werden. Die nach diesem Prinzip ermittelten Daten werden nach einem Bewertungssystem geordnet, welches die Daten entsprechend ihrem Sicherheitsgrad einstuft. Dem höchsten Sicherheitsgrad werden dabei immer die Daten zugeordnet, die

  • a) aus einer nicht öffentlichen Datenbank stammen und die sich
  • b) auf die Person selber beziehen.
The data obtained as part of the search process for the customer are searched, for example, for certain terms, or keywords or numbers that relate directly to the person of the customer or information from the environment of the customer. The search is preferably performed using knowledge management tools, such as knowledge filtering functions, which are capable of automatically classifying data. The automatic classification can be carried out by means of statistical methods, linguistic methods, cause-and-effect methods, or else by means of logically / linguistically / semantically independent class schemas. The data determined according to this principle are arranged according to a rating system which classifies the data according to their degree of security. The highest level of security is always assigned the data that
  • a) come from a non-public database and which are
  • b) relate to the person himself.

In der zweiten Stufe werden zu den zum Kunden ermittelten Daten (Schlagworte; Zahlenangaben), die im Rahmen des Sprechererkennungsprozesses als Antworten geeignet sind, die für einen Erkennungsdialoges dazugehörigen Fragen, zum Beispiel mittels eines linguistischen Systems/Moduls, generiert.In in the second stage, the data determined for the customer (keywords; Figures), which are used as part of the speaker recognition process Answers are suitable for a recognition dialog associated Questions, for example by means of a linguistic system / module generated.

Diese Fragen werden mit den Antworten verknüpft in einer Sprecherdatenbank 12 entsprechend dem für sie festgelegten Sicherheitsgrad abgespeichert.These questions are linked to the answers in a speaker database 12 stored according to the security level specified for them.

In der dritten Stufe, die den Sprechererkennungsprozess selber betrifft, werden aus den in der Sprecherdatenbank 12 gespeicherten Fragen, beispielsweise mittels eines Zufallsgenerators 14, die Fragen ausgewählt, die der Kunde im Rahmen des aktuell laufenden Erkennungsprozesses beantworten muss, bevor er eine Freigabe für das von ihm gewünschte Dienstangebot erhält.In the third stage, which concerns the speaker recognition process itself, those in the speaker database 12 stored questions, for example by means of a random number generator 14 , which selects questions that the customer must answer within the framework of the currently running recognition process, before he receives a release for the service offered by him.

Der Sicherheitsgrad des Sprechererkennungsprozesses wird beispielsweise dadurch bestimmt, das die Sprecherdatenbank 12 zwei Speicherbereiche aufweist, denen unterschiedliche Sicherheitsstufen zugewiesen sind. Der erste Speicherbereich ist vorzugsweise als der Bereich mit der höchsten Sicherheit konzipiert. Diesem Speicherbereich sind die Erkennungsdialoge zugeordnet, die aus internen Kundendatenbanken 4 stammen und die Daten beinhalten, die sich direkt auf die Person des Kunden selber beziehen und/oder vom Kunden angegeben wurden (Geburtstag, Anschrift, Schulort usw). Dem zweiten Speicherbereich sind die Erkennungsdialoge zugeordnet, die aus Daten von öffentlich zugänglichen Datenbanken 7 generiert wurden, und von denen aufgrund ihrer Struktur angenommen wird, dass sie nur der Kunde selber oder wenige Personen aus seinem Umfeld kennen. Diese Erkennungsdialoge können sich sowohl auf Daten zur Person des Kunden, als auch auf Daten zum Familienumfeld (Angaben zu Verwandtschaftsverhältnissen) oder auch auf Daten zu speziellen Qualifikationen, speziellen Tätigkeiten, Leistungen oder auch Hobbys des Kunden beziehen. Möglich sind auch Fragen, die aus dem Arbeitsumfeld oder aus der Biographie des Kunden abgeleitet wurden.The degree of security of the speaker recognition process is determined, for example, by the speaker database 12 has two memory areas to which different levels of security are assigned. The first storage area is preferably designed as the area with the highest security. This memory area is associated with the recognition dialogs that are made up of internal customer databases 4 and contain the data that relate directly to the person of the customer and / or specified by the customer (birthday, address, school location, etc.). The second memory area is associated with the recognition dialogs, which are data from publicly accessible databases 7 which, due to their structure, are supposed to be known only to the customer himself or a few persons in his environment. These recognition dialogs can relate both to personal data of the customer and to family environment data (information on relationships) or also to data on specific qualifications, special activities, services or even hobbies of the customer. Also possible are questions that arise from the working environment or the biography of the Customers were derived.

Die Sicherheitsstufe der Abfrage kann z. B. durch das Verhältnis festgelegt werden, nach welchem der Zufallsgenerator (14) auf den ersten Speicherbereich mit dem hohen Sicherheitsstandard oder auf den zweiten Speicherbereich mit dem geringeren Sicherheitsstandard zugreifen soll.The security level of the query can be z. B. be determined by the ratio, according to which the random number generator ( 14 ) should access the first storage area with the high security standard or the second storage area with the lower security standard.

Die Lösung kann entweder als Stand Alone Lösung oder auch im Verbund mit anderen Verifikationssystemen verwendet werden.The solution Can either be a stand alone solution or used in conjunction with other verification systems become.

Denkbar ist beispielsweise eine Verwendung zusammen mit einem Sprecherverifikationssystem, bei dem die Sprechererkennung auf der Basis des Vergleichs biometrischer Sprachparameter des Kunden erfolgt. Wenn der Kunde beispielsweise erkältet ist und daher über das biometrische Sprecherverifikationssystem nicht eindeutig bzw. nicht mit der notwendigen Sicherheit identifiziert werden kann, erfolgt als weiterer Schritt zur Identitätsprüfung ein zweiter nachgelagerter Verifikationsprozess auf der Grundlage verbaler Informationen nach der erfindungsgemäßen Lösung.Conceivable For example, use with a speaker verification system is included the speaker recognition on the basis of the comparison biometric Language parameters of the customer takes place. For example, if the customer has a cold and therefore about the biometric speaker verification system is not unique or can not be identified with the necessary certainty is done as a further step to identity verification a second downstream Verification process based on verbal information the solution according to the invention.

Die Erfindung lässt sich durch ein wissensbasiertes technisches System mit folgende Komponenten lösen:

  • – ein Sprachdialogsystem 2 zur Entgegennahme eines Kundenanrufes,
  • – ein Modul zum Erkennen des Kommunikationsanschlusses 16,
  • – ein Modul zur Generierung eines personenspezifischen Suchschlüssels 3, das Zugriff auf mindestens eine interne Kundendatenbank 4 hat,
  • – ein Modul zur Einbindung des Suchschlüssels 3 in eine Suchroutine 13 zur Suche nach durch den Suchschlüssel 3 definierten Informationen in internen Kundendatenbanken 4 und in öffentlich zugänglichen Datenbanken 7,
  • – eine Ergebnisdatenbank 8, auf der die zum Kunden ermittelten Daten gespeichert werden,
  • – ein Modul Wissensmanagement mit Filterfunktion 9, über das aus den zum Kunden ermittelten Daten die für einen Erkennungsdialog als Antwort geeigneten Daten herausgefiltert werden,
  • – ein Modul zur Fragegenerierung und Bewertung 10, in dem mittels auf logischen und semantischen Aspekten beruhenden Algorithmen aus den für den Erkennungsdialog geeigneten Daten Fragen generiert werden,
  • – ein Zufallsgenerator 14, für die Auswahl der dem Kunden zu stellenden Fragen und
  • – ein Modul zur Sprechererkennung 11, mit Zugriff auf eine Sprecherdatenbank 12, in der die für den Erkennungsdialog geeigneten Fragen zusammen mit den dazugehörenden Antworten gespeichert werden.
The invention can be solved by a knowledge-based technical system with the following components:
  • - a speech dialogue system 2 to receive a customer call,
  • A module for recognizing the communication port 16 .
  • - A module for generating a person-specific search key 3 , access to at least one internal customer database 4 Has,
  • - a module for the integration of the search key 3 in a search routine 13 to search by the search key 3 defined information in internal customer databases 4 and in publicly accessible databases 7 .
  • - a result database 8th on which the data determined for the customer are stored,
  • - a knowledge management module with filter function 9 in which the data suitable for a recognition dialogue are filtered out of the data determined for the customer,
  • - a module for question generation and evaluation 10 in which questions are generated by means of algorithms based on logical and semantic aspects from the data suitable for the recognition dialog,
  • - a random number generator 14 , for the selection of questions to be asked to the customer and
  • - a speaker recognition module 11 , with access to a speaker database 12 in which the questions suitable for the recognition dialog are stored together with the corresponding answers.

Nachfolgend wird die Erfindung anhand eines Ausführungsbeispiels näher erläutert.following The invention will be explained in more detail with reference to an embodiment.

1 zeigt anhand eines Blockschaltbildes eine Netzarchitektur welche die Applikation 17 der Erfindung ermöglicht. 1 shows on the basis of a block diagram a network architecture which the application 17 allows the invention.

In 2 ist ein Ablaufschema dargestellt, das die einzelnen Verfahrensschritte zur Erfindung aufzeigt.In 2 a flow chart is shown which shows the individual process steps of the invention.

Der im Folgenden beschriebenen Ausführungsform liegt ein Beispiel zugrunde, das darauf basiert, dass der Dienstanbieter über Kundendaten verfügt, die auf einer nur dem Dienstanbieter zugänglichen internen Kundendatenbank 4 gespeichert sind. Dabei kann es sich um kundenspezifische Daten, wie Daten zur Person des Kunden, Daten zu den technischen Komponenten über die der Kunde auf die vom Dienstanbieter zur Verfügung gestellten Dienste zugreift oder auch um Abrechnungsdaten handeln. Bei den Daten zu den technischen Komponenten handelt es sich zumeist um Daten zu Kommunikationsendgeräten des Kunden, die für Abrechnungsprozesse benötigt werden. Das können beispielsweise Daten zur Anschlusskennung (CLI, HRL oder IP-Adresse) sein, die mit den persönlichen Daten des Anschlussinhabers verknüpft sind. Im Ausführungsbeispiel werden insbesondere diese Daten als Grundlage für die Suche nach Informationen zu den einzelnen Kunden herangezogen. Nachfolgend werden die einzelnen Verfahrensschritte näher erläutert. Ausgangspunkt ist dabei der Anruf eines Kunden auf dem Portal eines Dienstanbieters auf dem das erfindungsgemäße System implementiert ist.The embodiment described below is based on an example based on the service provider having customer data stored on an internal customer database accessible only to the service provider 4 are stored. This can be customer-specific data, such as personal data of the customer, data on the technical components via which the customer accesses the services provided by the service provider, or billing data. The data for the technical components are usually data on communication terminals of the customer, which are required for billing processes. For example, this may be data about the port ID (CLI, HRL, or IP address) associated with the port owner's personal information. In the exemplary embodiment, in particular, these data are used as the basis for the search for information about the individual customers. The individual process steps are explained in more detail below. The starting point is the call of a customer on the portal of a service provider on which the system according to the invention is implemented.

Das Kundenendgerät 1, mit dem der Nutzer auf das System zugreift, kann ein Handy (mit der HLR), ein Personal Computer, ein Festnetztelefon (mit CLI) oder ein anderes Kundenendgerät mit der entsprechenden Anschlusskennung sein. Der Kunde ruft über sein Kundenendgerät 1 eine Rufnummer des Portals eines Dienstanbieters an, bei dem der Zugang über ein Sprachdialogsystem 2 gesteuert wird. Über ein Modul zum Erkennen des Telekommunikationsanschlusses 16 wird automatisch die Anschlusskennung, z. B. CLI, HLR, ANI, IP-Adresse, des Kundenendgerätes 1 des anrufenden Kunden ermittelt und als Schlüsselinformation an das Modul zur Generierung des Suchschlüssels 3 <name> weitergeleitet. Das Modul zur Generierung des Suchschlüssels 3 beinhaltet ein Suchsystem, das alle zur Generierung des personenspezifischen Suchprofils notwendigen Schlüsseldaten aus der internen Kundendatenbank 4 ausliest und übernimmt. Dabei handelt es sich insbesondere um die mit der Anschlusskennung des Kunden logisch verknüpften Namen- und Adressdaten, die nach der Generierung des Suchschlüssels in eine Suchroutine 13 eingebunden werden. In einer möglichen Ausführungsform kann die Suchroutine 13 in Verbindung mit dem Suchschlüssel selber als Suchmaschine 6 ausgebildet sein, die entsprechend dem durch die Suchroutine 13 festgelegten Modus in öffentlich zugänglichen Datenbanken 7 und/oder in internen Kundendatenbanken 4 Daten zu der Person recherchiert, die mit dem jeweiligen Suchprofil der Suchroutine 13 übereinstimmt. Eine weitere Möglichkeit besteht darin, den Zugriff der Suchroutine 13 auf die relevanten Kundendaten über eine externe Suchmaschine 6 vornehmen zu lassen. In diesem Fall sucht die externe Suchmaschine 6, beispielsweise mit dem personenbezogenen Suchschlüssel <name>, in den Datenbanken 4 und 7 die zu diesem Suchschlüssel relevanten Daten des Kunden heraus und legt sie in einer Ergebnisdatenbank 8 ab. Das Modul Wissensmanagement 9 filtert über seine Filterfunktion aus den in der Ergebnisdatenbank 8 abgelegten Daten die für die Generierung von Erkennungsdialogen geeigneten Kundendaten heraus und gibt sie an das Modul zur Fragegenerierung 10 weiter. Die Filterfunktion des Moduls Wissensmanagement 9 kann beispielsweise nach folgendem Schema ausgebildet sein.

  • 1. Klassifikation nach Vorgangszuordnung und Dokumententyp,
  • 2. Extraktion der relevanten Kundendaten und Informationen mit anschließender Validierung,
  • 3. Verifikation der extrahierten Kundendaten im Rahmen einer Plausibilitätsprüfung und eventuelle Nachbearbeitung.
The customer terminal 1 The user accessing the system can be a cell phone (with the HLR), a personal computer, a landline phone (with CLI), or another customer terminal with the appropriate port ID. The customer calls over his customer terminal 1 a telephone number of the portal of a service provider, in which access via a voice dialogue system 2 is controlled. Via a module for recognizing the telecommunication connection 16 is automatically the connection identifier, z. CLI, HLR, ANI, IP address, the customer's terminal 1 of the calling customer and as key information to the module for generating the search key 3 <name> forwarded. The module for generating the search key 3 includes a search system that contains all key data necessary to generate the person-specific search profile from the internal customer database 4 reads out and takes over. These are, in particular, the name and address data logically linked to the customer's connection ID, which are generated after generation the search key in a search routine 13 be involved. In one possible embodiment, the search routine 13 in conjunction with the search key itself as a search engine 6 be formed according to the by the search routine 13 specified mode in publicly accessible databases 7 and / or in internal customer databases 4 Data on the person researched with the respective search profile of the search routine 13 matches. Another possibility is to access the search routine 13 to the relevant customer data via an external search engine 6 to have it done. In this case, the external search engine searches 6 , for example, with the personal search key <name>, in the databases 4 and 7 identify the customer's data relevant to this search key and place it in a results database 8th from. The module Knowledge Management 9 filters via its filter function from those in the results database 8th stores the customer data suitable for the generation of recognition dialogues and sends them to the question-and-answer module 10 further. The filter function of the Knowledge Management module 9 may be formed, for example, according to the following scheme.
  • 1. Classification according to transaction assignment and document type,
  • 2. Extraction of relevant customer data and information with subsequent validation,
  • 3. Verification of the extracted customer data as part of a plausibility check and possible post-processing.

Im nachgeordneten Modul zur Fragegenerierung und Bewertung 10 werden mittels Logik- und Semantikfunktion aus den relevanten Kundendaten Fragen für den jeweiligen Erkennungsdialog generiert.In the subordinate module for question generation and evaluation 10 Logic and semantic functions generate questions for the respective recognition dialog from the relevant customer data.

Beispielweise lassen sich aus der Information <Geboren am 25.07.1959> Fragen für einen Erkennungsdialog nach folgenden Inhalten generieren:

  • – Tag der Geburt,
  • – Monat der Geburt,
  • – Jahr der Geburt,
  • – Datum der Geburt,
  • – Wochentag der Geburt, und
  • – zeitliche Ereignisse am Tag der Geburt
For example, you can use the information <Born on 25.07.1959> to generate questions for a recognition dialog according to the following contents:
  • - Day of birth,
  • - month of birth,
  • - year of birth,
  • - Date of birth,
  • - Weekday of birth, and
  • - temporal events on the day of birth

Wenn für den Kunden genügend Fragen zu möglichen Erkennungsdialogen generiert sind, erfolgt eine Bewertung der Fragen. Die Bewertung kann beispielsweise nach zeitlicher Nähe eines Ereignisses, nach einem aktuellen Datum, nach einer Ereigniszeitdifferenz von beispielsweise einem Monat, nach der Örtlichkeit, und nach Übereinstimmungsmerkmalen vorgenommen werden.If for the Customers enough Questions about possible Identification dialogues are generated, the questions are evaluated. For example, the rating may be based on the time proximity of a Event, after a current date, after an event time difference for example, one month, by location, and by match features be made.

Wenn beispielsweise ein Name aus Großbritannien gesucht wird, kann eine Bewertung nach der Örtlichkeit vorgenommen werden. In diesem Fall werden Informationen aus den USA weniger gewichtet.If for example, a name from the UK is searched, a rating can be made according to the location. In this case, information from the US is less weighted.

Wenn viele Merkmale, wie Geburtstag, Geburtsort, Vorname, aktuelle Wohnadresse übereinstimmen, erfolgt eine größere Gewichtung. Stimmen weniger Merkmale überein, erfolgt eine geringere Gewichtung.If many characteristics, such as birthday, place of birth, first name, current home address match, there is a larger weighting. If there are fewer features, a lower weighting takes place.

Gleichzeitig können z. B. mittels eines Zufallsgenerators 14, die einzelnen Fragen ausgewählt werden, die dem Kunden im Rahmen des Erkennungsdialoges gestellt werden. Die jeweils für den Erkennungsdialog ausgewählten Fragen und die und Antworten werden in der Sprecherdatenbank 12 für den Verifikationsdialog zur Verfügung gestellt.At the same time z. B. by means of a random number generator 14 which are selected for individual questions that are asked to the customer as part of the recognition dialog. The questions and answers selected for the recognition dialog will be in the speaker database 12 provided for the verification dialogue.

Ein bevorzugtes Anwendungsgebiet ist der Einsatz der Erfindung als Ergänzung zu einem Sprechererkennungssystem, das auf dem Vergleich von biometrischen Daten des Kunden beruht. Wird beispielsweise eine Sprechererkennungsverfahren eingesetzt, das auf der Sprachanalyse von personenspezifischen Sprachparametern erfolgt, wird üblicherweise vom System über eine Sprecherverifikationsreferenzdatenbank mittels eines entsprechenden Verifikationsalgorithmus geprüft, ob das Passwort von der dem Passwort zugewiesenen Stimme gesprochen wurde. Wenn der Verifikationsalgorithmus eine „Übereinstimmung" feststellt, wird dem Teilnehmer Zugriff auf den gewünschten Dienst gewährt. Wenn der Algorithmus die Stimme nur nahezu mit der für den Vergleich gespeicherten Stimme in Übereinstimmung bringen kann, sich der Erkennungsgrad aber nicht innerhalb eines bestimmten Akzeptanzkriteriums befindet, so kann der Teilnehmer zusätzlich zur Beantwortung von Fragen aufgefordert werden, die geeignet sind, die Identität des Teilnehmers zu bestätigen. Diese Notwendigkeit wird sich immer dann ergeben, wenn sich die Stimme des Teilnehmers, beispielsweise bei einer Erkältung verändert hat, oder wenn Hintergrundgeräusche, wie Bahnhofsgeräusche, Fluglärm oder auch Halleffekte den Verifikationsvorgang erschweren. Bei den bekannten Lösungen werden in diesen oder ähnlichen Fällen, zusätzlich zur Sprechererkennung anhand von biometrischer Daten, vorher vereinbarte personenspezifische Informationen abgefragt, die jedoch die im Stand der Technik beschriebenen Nachteile aufweisen. An dieser Stelle lässt sich die erfindungsgemäße Lösung vorteilhaft einsetzen, da eine vorherige Absprache der abzufragenden Informationen zwischen Teilnehmer und System nicht mehr notwendig ist. Der bei den bekannten Lösungen erforderliche vorgeordnete Abfragedialog zwischen dem System und dem Teilnehmer entfällt damit vollständig. Ein weiterer Vorteil ist darin zu sehen, dass nicht mehr nur eine in sich geschlossenen Menge von Abfragedaten zur Verfügung steht, sondern dass der Umfang der Abfragemöglichkeiten nahezu unbegrenzt ist.A preferred field of application is the use of the invention as a supplement to a speaker recognition system based on the comparison of biometric data of the customer. If, for example, a speaker recognition method is used which takes place on the speech analysis of person-specific speech parameters, it is usually checked by the system via a speaker verification reference database by means of a corresponding verification algorithm whether the password has been spoken by the voice assigned to the password. If the verification algorithm detects a "match," the subscriber is granted access to the desired service: if the algorithm can match the voice almost only to the voice stored for comparison, but the recognition level is not within a certain acceptance criterion, then In addition, the participant may be asked to answer questions that are likely to confirm the identity of the participant, and this need will always arise when the participant's voice has changed, for example, during a cold, or when there is background noise, such as station sounds In the known solutions, in these or similar cases, in addition to the speaker recognition on the basis of biometric data, previously agreed person-specific information is queried, but in the state of T have described technology disadvantages. At this point, the solution according to the invention can be used advantageously, since prior consultation of the information to be queried between subscriber and system is no longer necessary. The required in the known solutions upstream query dialog between the system and the subscriber is thus completely eliminated. Another advantage is the fact that not only a self-contained set of query data is available, but that the scope of the query options is almost unlimited.

Die Erkennungsdialoge können dabei ständig dem aktuellen Stand angepasst werden, da sie jederzeit auch ohne die Mitwirkung des Kunden erweiterbar und damit quasi automatisiert selbstadaptierbar sind.The Detection dialogs can constantly be adapted to the current state, as they are always without the involvement of the customer extensible and thus virtually automated are self-adaptable.

11
Kundenendgerätcustomer terminal
22
SprachdialogsystemVoice control system
33
Modul zur Generierung eines Suchschlüsselsmodule to generate a search key
44
Interne Kundendatenbankinternal Customer database
55
Mittel zur Einbindung des Suchschlüssels in eine Suchroutinemedium to integrate the search key in a search routine
66
SuchmaschineSearch Engine
77
Öffentlich zugängliche DatenbankenPublic accessible databases
88th
ErgebnisdatenbankResults database
99
Modul Wissensmanagement mit Filterfunktionmodule Knowledge management with filter function
1010
Modul zur Fragegenerierung und Bewertungmodule for question generation and evaluation
1111
Modul zur Sprechererkennungmodule for speaker recognition
1212
SprecherdatenbankSpokesman database
1313
Suchroutinebrowser
1414
ZufallsgeneratorRandom
1515
Telekommunikationsnetz, Net, InternetTelecommunications network Net, Internet
1616
Modul zum Erkennen des Telekommunikationsanschlussesmodule for recognizing the telecommunication connection
1717
Applikation der Erfindung (1)Application of the invention ( 1 )

Claims (13)

Verfahren zur wissensbasierten Sprechererkennung von Kommunikationsteilnehmern unter Verwendung eines Sprechererkennungssystems, das auf dem Prinzip der Technik der Sprechererkennung mittels verbaler Informationen basiert, dadurch gekennzeichnet, das das Sprechererkennungssystem mit einem wissensbasierten System verknüpft ist, bei welchem mittels einer Suchroutine (13) vorzugsweise über eine Suchmaschine (6) aus mindestens einer über ein Kommunikationsnetz (15) öffentlich zugänglichen Informationsdatenbank (7) und/oder mindestens einer internen Kundendatenbank (4) anhand eines in der Suchroutine (13) eingestellten personenbezogenen Suchprofils Daten zu der durch das Suchprofil in ihrer Identität eindeutig gekennzeichneten Person ermittelt werden, das aus den zur Person ermittelten Daten über eine Filterfunktion für eine Sprechererkennungsanfrage geeignete Daten herausgezogen werden, die als Antwort für eine Sprechererkennungsanfrage definiert sind, und dass zu den als Antwort für einen Sprechererkennungsprozess geeigneten Daten automatisch die dazugehörenden Fragen generiert werden, die zusammen mit den Antworten in einer Sprecherdatenbank (12) für die Sprecherverifikation abgespeichert werden.Method for the knowledge-based speaker recognition of communication subscribers using a speaker recognition system based on the principle of speech recognition technology by means of verbal information, characterized in that the speaker recognition system is linked to a knowledge-based system in which by means of a search routine ( 13 ) preferably via a search engine ( 6 ) from at least one via a communications network ( 15 ) publicly available information database ( 7 ) and / or at least one internal customer database ( 4 ) using one in the search routine ( 13 In the personal search profile set, data relating to the person uniquely identified by the search profile is extracted, data suitable for the person identified is extracted via a filter function for a speaker recognition request and defined as the answer to a speaker recognition request, and that the in response to a speaker recognition process, the associated questions are automatically generated, together with the answers in a speaker database ( 12 ) are stored for the speaker verification. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass über die Filterfunktion aus den über das Kommunikationsnetz ermittelten Daten sowohl Daten, die direkt die zu erkennende Person betreffen, als auch Daten, die dem persönlichen Umfeld der zu erkennenden Person zuzuordnen sind, herausgefiltert werden.Method according to claim 1, characterized in that that over the filter function from the over the Communication network data collected both the data directly person to be recognized, as well as personal information Environment of the person to be recognized are filtered out become. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die für die Sprechererkennung in der Sprecherdatenbank (12) gespeicherten Fragen und Antworten mindestens zwei unterschiedlichen, einzeln ansteuerbaren Datenbankbereichen zugeordnet werden, die sich aufgrund des für sie festgelegten Sicherheitsgrades/Sicherheitsstandards unterscheiden, wobei die Fragen und Antworten, die aus den Daten von nicht öffentlich zugänglichen internen Kundendatenbanken (4) abgeleitet wurden und die sich direkt auf die zu erkennende Person beziehen, in dem mit einem hohen Sicherheitsgrad/Sicherheitsstandard gekennzeichneten Datenbankbereich der Sprecherdatenbank (12) abgespeichert werden, und dass die Fragen und Antworten, die aus Daten von öffentlich zugänglichen Datenbanken (7) abgeleitet wurden und die sich auf das persönliche Umfeld der zu erkennenden Person beziehen, in dem mit einem geringeren Sicherheitsgrad/Sicherheitsstandard gekennzeichneten Datenbankbereich der Sprecherdatenbank (12) abgespeichert werden.Method according to one of the preceding claims, characterized in that for the speaker recognition in the speaker database ( 12 ) are assigned to at least two different, individually addressable database areas, which differ according to the security level / security standards set for them, whereby the questions and answers resulting from the data of non-publicly accessible internal customer databases ( 4 ) and which relate directly to the person to be recognized, in the database area of the speaker database (with a high degree of security / security standard) ( 12 ) and that the questions and answers resulting from data from publicly accessible databases ( 7 ) and which relate to the personal environment of the person to be recognized, in the database area of the speaker database (with a lower security level / security standard) ( 12 ) are stored. Verfahren einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die konkrete Auswahl der innerhalb eines Sprechererkennungsprozesses durch die zu erkennende Person zu beantwortenden Fragen nach dem Zufallsprinzip über einen Zufallsgenerator (14) vorgenommen wird, wobei das Verhältnis, nach dem der Zufallsgenerator (14) auf die mit unterschiedlich hohem Sicherheitsgraden/Sicherheitsstandards eingestuften Abfragedaten zugreift, entsprechend dem für den aktuellen Sprechererkennungsprozess erforderlichen Sicherheitsstandard/Sicherheitsgrad automatisch eingestellt wird.Method according to one of the preceding claims, characterized in that the concrete selection of the questions to be answered within a speaker recognition process by the person to be recognized randomly via a random number generator ( 14 ), the ratio according to which the random number generator ( 14 ) accesses the polling data classified with varying degrees of security / security, according to the security standard / security level required for the current speaker recognition process. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Abfrage nach persönlichen Daten, die für die Generation von Sprechererkennungsanfragen über das Kommunikationsnetz geeignet sind, kontinuierlich nach einem vorab festlegbaren Zeitschema/Triggerimpuls, welches/welcher der automatischen Aktivierung und/oder Deaktivierung der Suchroutine (13) zugrunde liegt, erfolgt.Method according to one of the preceding claims, characterized in that the query for personal data which is suitable for the generation of speaker recognition requests via the communication network, continuously according to a pre-definable time scheme / trigger pulse, which / which of the automatic activation and / or deactivation of the search routine ( 13 ). Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Suchroutine (13) zur Generierung neuer Erkennungsanfragen automatisch aktiviert wird, wenn der Vorrat an möglichen Erkennungsdialogen ein festgelegtes Limit unterschreitet und automatisch wieder deaktiviert wird, wenn das festgelegte Limit an Erkennungsdialogen wieder erreicht ist.Method according to one of the preceding claims, characterized in that the search routine ( 13 ) is automatically activated to generate new recognition requests when the supply of possible detection dialogs falls below a set limit and is automatically deactivated again when the set limit of detection dialogs is reached again. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Suchroutine, die der Suche nach personenbezogenen Daten über das Internet zugrunde liegt, eine Zeitfunktion enthält, die den zeitlichen Rahmen in den zu durchsuchenden internen Kundendatenbanken (4) und öffentlich zugänglichen Datenbanken (7) auf einen vorab in der Suchroutine (13) eingestellten Suchzeitraum begrenzt.Method according to one of the preceding claims, characterized in that the search routine on which the search for personal data via the Internet is based contains a time function which determines the time frame in the internal customer databases ( 4 ) and publicly accessible databases ( 7 ) in advance in the search routine ( 13 ) is limited. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Zeitfunktion der Suchroutine (13) so eingestellt wird, das die zu generierenden Sprechererkennungsanfragen aus Daten resultieren, denen tagaktuelle Informationen zur erkennende Person bzw. tagaktuelle Informationen zu Tätigkeiten der zu erkennenden Person zugrunde liegen.Method according to one of the preceding claims, characterized in that the time function of the search routine ( 13 ) is set such that the speaker recognition requests to be generated result from data which is based on up-to-the-minute information about the recognizing person or up-to-the-minute information on activities of the person to be recognized. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Erstellung des der Suchroutine (13) zugrunde liegenden personenbezogenen Suchprofils automatisch erfolgt, wobei zur Erstellung des konkreten Suchprofils/Suchschlüssels auf interne Kundendatenbanken (4) des Dienstanbieters/Providers zugegriffen wird, für dessen Sprechererkennungsprozess das personenbezogene Suchprofil erstellt werden soll.Method according to one of the preceding claims, characterized in that the creation of the search routine ( 13 ), whereby the search profile / search key is created on internal customer databases ( 4 ) of the service provider / provider for whose speaker recognition process the personal search profile is to be created. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, das die automatische Erstellung des Suchprofils über die Anschlusskennung eines Kommunikationsendgerätes (CLI; HLR, ANI; IP-Adresse) im Zusammenhang mit den mit der Anschlusskennung, Adressidentifikator, verknüpften persönlichen Daten des Anschlussinhabers oder den persönlichen Daten der zur betreffenden Anschlusskennung registrierten berechtigten Personen erfolgt.Method according to one of the preceding claims, characterized marked that the automatic creation of the search profile over the Connection identifier of a communication terminal (CLI, HLR, ANI, IP address) in connection with the personal associated with the port identifier, address identifier Data of the subscriber or the personal data of the person concerned Connection ID registered authorized persons. System zur wissensbasierten Sprechererkennung, bestehend aus – einem Sprachdialogsystem (2) zur Entgegennahme eines Kundenanrufes, – einem Modul zur Abfrage und zum Erkennen des Telekommunikationsanschlusses (16) anhand der Anschlusskennung (CLI, HLR, ANI, IP-Adresse), – einem Modul zur Generierung eines Suchschlüssels (3) mit Zugriff auf eine interne Kundendatenbank (4) zur Ermittlung des personenspezifischen Suchschlüssels des Kunden, dem die Kommunikationsanschlusskennung zugeordnet ist, – einem Modul zur Einbindung des Suchschlüssels in eine Suchroutine (13) zur Suche nach durch den Suchschlüssel in Verbindung mit der Suchroutine (13) definierten Informationen, wobei die Suche über eine Suchmaschine (6) in internen Kundendatenbanken (4) und/oder in öffentlich zugänglichen Datenbanken (7), vorzugsweise über das Internet, erfolgt, – einer Ergebnisdatenbank (8), auf der die zum Kunden ermittelten Daten gespeichert werden, – einem Modul Wissensmanagement mit Filterfunktion (9) mit Zugriff auf die Ergebnisdatenbank (8), über das aus den zum Kunden ermittelten Daten die für einen Erkennungsdialog als Antwort geeigneten Daten herausgefiltert werden, – einem Modul zur Fragegenerierung, und Bewertung (10), in dem mittels auf logischen und semantischen Aspekten beruhenden Algorithmen aus den für den Erkennungsdialog als Antwort geeigneten Daten Fragen generiert werden, und – einem Modul zur Sprechererkennung (11), mit Zugriff auf eine Sprecherdatenbank (12), in der die für den Erkennungsdialog geeigneten Fragen zusammen mit den dazugehörenden Antworten abfragebereit gespeichert werden.A system for knowledge-based speaker recognition, comprising - a speech dialogue system ( 2 ) for receiving a customer call, - a module for interrogation and recognition of the telecommunications connection ( 16 ) based on the connection identifier (CLI, HLR, ANI, IP address), - a module for generating a search key ( 3 ) with access to an internal customer database ( 4 ) for determining the person-specific search key of the customer to which the communication connection identifier is assigned, - a module for integrating the search key into a search routine ( 13 ) to search by the search key in conjunction with the search routine ( 13 ) information, whereby the search via a search engine ( 6 ) in internal customer databases ( 4 ) and / or in publicly accessible databases ( 7 ), preferably via the Internet, - a result database ( 8th ), on which the data determined to the customer are stored, - a module knowledge management with filter function ( 9 ) with access to the results database ( 8th ), from which the data determined for a recognition dialog are filtered out from the data determined for the customer, a module for question generation, and evaluation ( 10 ), in which questions are generated by means of algorithms based on logical and semantic aspects from the data which are suitable for the recognition dialogue in response, and - a module for speaker recognition ( 11 ), with access to a speaker database ( 12 ), in which the questions which are suitable for the recognition dialog are stored together with the associated answers ready for interrogation. System zur wissensbasierten Sprechererkennung nach Anspruch 11, dadurch gekennzeichnet, dass die Sprecherdatenbank (12) mindestens zwei unterschiedliche Speicherbereiche für Erkennungsdialoge aufweist, wobei im ersten Speicherbereich Erkennungsdialoge mit einer hohen Sicherheitsstufe und im zweiten Speicherbereich Erkennungsdialoge mit einer niedrigeren Sicherheitsstufe gespeichert werden.A system for knowledge-based speaker recognition according to claim 11, characterized in that the speaker database ( 12 ) has at least two different storage areas for recognition dialogs, wherein in the first storage area recognition dialogues are stored with a high security level and in the second storage area recognition dialogues with a lower security level. System zur wissensbasierten Sprechererkennung nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Auswahl der Fragen für eine Verifikationsanfrage über einen Zufallsgenerator (14) erfolgt.Knowledge-based speaker recognition system according to one of the preceding claims, characterized in that the selection of the questions for a verification request via a random number generator ( 14 ) he follows.
DE200410014414 2004-03-18 2004-03-18 Method for speaker identification for telecommunication network, involves ascertaining data on the identity of a person characterized by a search profile Ceased DE102004014414A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE200410014414 DE102004014414A1 (en) 2004-03-18 2004-03-18 Method for speaker identification for telecommunication network, involves ascertaining data on the identity of a person characterized by a search profile

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE200410014414 DE102004014414A1 (en) 2004-03-18 2004-03-18 Method for speaker identification for telecommunication network, involves ascertaining data on the identity of a person characterized by a search profile

Publications (1)

Publication Number Publication Date
DE102004014414A1 true DE102004014414A1 (en) 2005-10-06

Family

ID=34980730

Family Applications (1)

Application Number Title Priority Date Filing Date
DE200410014414 Ceased DE102004014414A1 (en) 2004-03-18 2004-03-18 Method for speaker identification for telecommunication network, involves ascertaining data on the identity of a person characterized by a search profile

Country Status (1)

Country Link
DE (1) DE102004014414A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11861521B2 (en) 2021-12-21 2024-01-02 PolyAI Limited System and method for identification and verification

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5897616A (en) * 1997-06-11 1999-04-27 International Business Machines Corporation Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
EP1249016B1 (en) * 2000-01-06 2003-09-10 Deutsche Telekom AG Method for the voice-operated identification of the user of a telecommunication line in a telecommunications network during an interactive communication using a voice-operated conversational system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5897616A (en) * 1997-06-11 1999-04-27 International Business Machines Corporation Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
EP1249016B1 (en) * 2000-01-06 2003-09-10 Deutsche Telekom AG Method for the voice-operated identification of the user of a telecommunication line in a telecommunications network during an interactive communication using a voice-operated conversational system

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LI,Qi, et.al.: Automatic Verbal Information Verification for User Athentication. In: IEEE Transactions On Speech And Audio Processing, Vol.8, No.5, Sept. 2000, S.585-596 *
LI,Qi, et.al.: Automatic Verbal Information Verification for User Athentication. In: IEEE Transactions On Speech And Audio Processing, Vol.8, No.5, Sept. 2000, S.585-596;

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11861521B2 (en) 2021-12-21 2024-01-02 PolyAI Limited System and method for identification and verification

Similar Documents

Publication Publication Date Title
DE69421310T2 (en) System for checking the protection word
DE69624848T2 (en) METHOD FOR CHECKING A SPEAKER
DE69425818T2 (en) SYSTEM AND METHOD FOR VOICE COMMAND CONTROL AND SPEAKER IDENTITY CHECK
DE102007033812B4 (en) Method and arrangement for authenticating a user of facilities, a service, a database or a data network
DE69727519T2 (en) Data network with voice control means
DE102008058883B4 (en) Method and arrangement for controlling user access
DE69428606T2 (en) VOICE-CONTROLLED ACCOUNT ACCESS THROUGH A TELEPHONE NETWORK
DE69427322T2 (en) A speaker identity verification method and system
DE69926977T2 (en) Caller identification authentication and routing in response
DE19910236A1 (en) Speech recognition method
EP1577733A2 (en) Method and system for persons/speaker verification via communication systems
EP1848187B1 (en) Method and device for verifying the identity of a user of various telecommunication services using biometric characteristics
WO2001050455A1 (en) Method for the voice-operated identification of the user of a telecommunication line in a telecommunications network during an interactive communication using a voice-operated conversational system
DE60103258T2 (en) SECURED SERVICES
WO2002003668A1 (en) Control of access for telephone service providers by means of voice recognition
DE10060654C1 (en) Method and device for the automatic issuing of information by means of a search engine
WO2007101821A1 (en) Method for identifying spit or spam for voip
WO1999045690A1 (en) Method and device for universal access to telephone networks
DE102004014414A1 (en) Method for speaker identification for telecommunication network, involves ascertaining data on the identity of a person characterized by a search profile
EP1749395B1 (en) Method for authorizing a telephone transaction and switching node
DE69929416T2 (en) Method and suitable server for remote services
EP3893476B1 (en) Method for improved identification and / or authentication of a user in the context of a telephone connection or a voice call of the user with a voice telephone system, system, telecommunication network, computer program and computer readable medium
DE19726265C2 (en) Method for operating a system for using a chip card
DE69725252T2 (en) Language testing method and apparatus
EP4064081B1 (en) Method and system for identifying and authenticating a user in an ip network

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
8110 Request for examination paragraph 44
R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final