DE102008062923B4 - Method and device for generating a hit list in automatic speech recognition - Google Patents
Method and device for generating a hit list in automatic speech recognitionInfo
- Publication number
- DE102008062923B4 DE102008062923B4 DE102008062923.5A DE102008062923A DE102008062923B4 DE 102008062923 B4 DE102008062923 B4 DE 102008062923B4 DE 102008062923 A DE102008062923 A DE 102008062923A DE 102008062923 B4 DE102008062923 B4 DE 102008062923B4
- Authority
- DE
- Germany
- Prior art keywords
- hit list
- speech recognition
- hit
- word group
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Navigation (AREA)
Abstract
Verfahren zur Erzeugung einer Trefferliste bei einer automatischen Spracherkennung, wobei die Trefferliste mindestens eine Trefferlisten-Wortgruppe umfasst, welche ausgehend von einer gesprochenen Wortgruppe von der Spracherkennung als mögliche Treffer erzeugt wird,
wobei jede Wortgruppe mindestens ein Wort umfasst,
dadurch gekennzeichnet,
dass die Trefferliste ausgehend von mindestens einer Ausgangs-Wortgruppe, welche von der Spracherkennung als ein Treffer bestimmt wird, mittels des Levenshtein-Verfahrens erzeugt wird, wobei die Trefferliste die mindestens eine Ausgangs-Wortgruppe umfasst.
Method for generating a hit list in automatic speech recognition, wherein the hit list comprises at least one hit list word group which is generated by the speech recognition as possible hits based on a spoken word group,
where each group of words includes at least one word,
characterized by
that the hit list is generated from at least one source word group, which is determined by the speech recognition as a hit, using the Levenshtein method, wherein the hit list includes the at least one source word group.
Description
Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung, um bei einer automatischen Spracherkennung eine Trefferliste zu erzeugen.The present invention relates to a method and a device for generating a hit list in automatic speech recognition.
Die
Die
Die
Die
Die
Die
Die
Statistische Spracherkennungssysteme berechnen aus der von einem Nutzer gesprochenen Wortgruppe (z.B. einem Sprachbefehl) eine geordnete Trefferliste von möglichen erkannten Wortgruppen, welche im so genannten Wortschatz des Spracherkennungssystems definiert sind. Diese Trefferliste ist nach einem Konfidenzmaß geordnet, welches die laut Repräsentation der im Wortschatz enthaltenen Wortgruppen mit der tatsächlichen Nutzereingabe (mit der gesprochenen Wortgruppe) vergleicht. In die Berechnung der Ähnlichkeit fließen neben symbolischen Faktoren (z.B. ein entsprechendes im Wortschatz hinterlegtes Lautsymbol) auch signalbezogene Parameter (z.B. Sprechereigenschaften) mit ein. Dies führt dazu, dass dem besten Treffer häufig Alternativen folgen, welche nach der erkannten akustischen Ähnlichkeit geordnet sind. Diese Ordnung ist allerdings dem durchschnittlichen Nutzer nicht nachvollziehbar.Statistical speech recognition systems calculate an ordered list of possible recognized word groups from a user's spoken word group (e.g., a voice command). These word groups are defined in the system's vocabulary. This list is ordered according to a confidence level that compares the word groups represented in the vocabulary with the actual user input (the spoken word group). The similarity calculation incorporates not only symbolic factors (e.g., a corresponding sound symbol stored in the vocabulary) but also signal-related parameters (e.g., speaker characteristics). This often results in the best match being followed by alternatives ordered according to the perceived acoustic similarity. However, this order is not readily apparent to the average user.
Daher ist es die Aufgabe der vorliegenden Erfindung, die Trefferliste bei einer automatischen Spracherkennung derart zu erstellen, dass die Ordnung der Trefferliste dem Nutzer einsichtiger ist, als dies nach dem Stand der Technik der Fall ist.Therefore, the object of the present invention is to create the hit list in an automatic speech recognition system in such a way that the order of the hit list is more intuitive for the user than is the case according to the prior art.
Erfindungsgemäß wird diese Aufgabe durch ein Verfahren zur Erzeugung einer Trefferliste nach Anspruch 1, durch eine Vorrichtung zur Erzeugung einer Trefferliste nach Anspruch 5 und ein Fahrzeug nach Anspruch 7 gelöst. Die abhängigen Ansprüche definieren bevorzugte und vorteilhafte Ausführungsformen der vorliegenden Erfindung.According to the invention, this problem is solved by a method for generating a hit list according to claim 1, by a device for generating a hit list according to claim 5, and by a vehicle according to claim 7. The dependent claims define preferred and advantageous embodiments of the present invention.
Im Rahmen der vorliegenden Erfindung wird ein Verfahren zur Erzeugung einer Trefferliste bei einer automatischen Spracherkennung bereitgestellt. Dabei umfasst die Trefferliste mindestens eine Trefferlisten-Wortgruppe, d.h. die Trefferliste umfasst demnach eine oder mehrere Trefferlisten-Wortgruppen. Unter einer Wortgruppe wird dabei eine Aneinanderreihung von einem Wort oder eine Aneinanderreihung von mehreren Wörtern verstanden. Die Trefferliste wird ausgehend von einer beispielsweise von einem Benutzer gesprochenen Wortgruppe von der Spracherkennung als mögliche Treffer erzeugt. Zur Erzeugung der Trefferliste wird von mindestens einer Ausgangs-Wortgruppe (also einer oder mehreren Ausgangs-Wortgruppen) ausgegangen, wobei diese mindestens eine Ausgangs-Wortgruppe von der Spracherkennung als Treffer bestimmt wird. Abhängig oder ausgehend von dieser mindestens einen Ausgangs-Wortgruppe wird mittels des Levenshtein-Verfahrens die Trefferliste derart erstellt, dass die Trefferliste die mindestens eine Ausgangs-Wortgruppe umfasst.The present invention provides a method for generating a hit list in automatic speech recognition. The hit list comprises at least one hit list word group, i.e., it includes one or more hit list word groups. A word group is understood to be a sequence of one word or a sequence of several words. The hit list is generated by the speech recognition system based on a word group spoken, for example, by a user, as potential matches. The hit list is generated from at least one initial word group (i.e., one or more initial word groups), which is identified as a match by the speech recognition system. Based on or depending on this initial word group, the hit list is created using the Levenshtein method such that it includes the initial word group.
Anders ausgedrückt erzeugt die Spracherkennung mehrere Ausgangs-Wortgruppen, aus welchen dann mittels des Levenshtein-Verfahrens die Trefferliste erzeugt wird. Dabei können die Ausgangs-Wortgruppen beispielsweise mittels des Levenshtein-Verfahrens sortiert werden, wie es im Folgenden noch ausgeführt wird, oder es können ausgehend von den Ausgangs-Wortgruppen mittels des Levenshtein-Verfahrens weitere Treffer erzeugt werden, wobei die dann entstehende Trefferliste wiederum mittels des Levenshtein-Verfahrens sortiert werden kann.In other words, speech recognition generates several source word groups, from which the hit list is then generated using the Levenshtein algorithm. The source word groups can be sorted using the Levenshtein algorithm, as will be explained below, or further hits can be generated from the source word groups using the Levenshtein algorithm, and the resulting hit list can then be sorted using the Levenshtein algorithm.
Durch den Einsatz des Levenshtein-Verfahrens entsteht eine Trefferliste, welche aus Wortgruppen oder Zeichenketten besteht und welche mit Hilfe der symbolischen Ähnlichkeit dieser Wortgruppen aufgebaut ist. Dadurch weisen die in der Trefferliste enthaltenen Treffer oder Wortgruppen eine ähnliche Orthographie oder sind entsprechend der Orthographie geordnet, so dass die Trefferliste insgesamt ein Ergebnis der Spracherkennung liefert, welches für den Benutzer nachvollziehbarer ist, als dies nach dem Stand der Technik der Fall ist.The Levenshtein algorithm generates a hit list consisting of word groups or strings, structured based on the symbolic similarity of these groups. This ensures that the hits or word groups in the list share similar spelling or are ordered according to spelling, resulting in a speech recognition result that is more comprehensible to the user than is possible with current technology.
Gemäß einer erfindungsgemäßen Ausführungsform umfasst die Trefferliste mehrere Trefferlisten-Wortgruppen. Dabei ermittelt die Spracherkennung innerhalb der Elemente oder Wortgruppen der Trefferliste den besten Treffer und sortiert die Elemente der Trefferliste gemäß der Levenshtein-Distanz, die jedes Element der Trefferliste jeweils von dem besten Treffer besitzt, wobei der beste Treffer das erste Element der Trefferliste ist. Bei dieser Sortierung wird mit ansteigender Levenshtein-Distanz sortiert, so dass die dem besten Treffer in der Trefferliste folgenden Treffer eine geringere Levenshtein-Distanz aufweisen, als diejenigen Treffer in der Trefferliste, welche weiter hinten oder am Schluss der Trefferliste einsortiert werden. Demnach wird gemäß dieser Ausführungsform nach zunehmender Levenshtein-Distanz geordnet oder sortiert, und die Trefferliste beginnt mit dem besten Treffer bzw. einer Levenshtein-Distanz von 0.According to one embodiment of the invention, the hit list comprises several hit list word groups. The speech recognition system identifies the best match within the elements or word groups of the hit list and sorts the elements of the hit list according to the Levenshtein distance that each element of the hit list has from the best match, with the best match being the first element of the hit list. This sorting is performed with increasing Levenshtein distance, so that the hits following the best match in the hit list have a smaller Levenshtein distance than those hits that are further down or at the end of the hit list. Thus, according to this embodiment, the hit list is ordered or sorted according to increasing Levenshtein distance, and it begins with the best match or a Levenshtein distance of 0.
Die gemäß dieser Ausführungsform entstehende Trefferliste ist gemäß abnehmender symbolischer Ähnlichkeit oder abnehmender Ähnlichkeit auf Buchstabenebene geordnet, so dass diejenigen Treffer, welche eine höhere symbolische Ähnlichkeit mit dem besten Treffer aufweisen, weiter oben in der Trefferliste stehen, als diejenigen Treffer, welche eine geringere symbolische Ähnlichkeit mit dem besten Treffer aufweisen.The hit list resulting from this embodiment is ordered according to decreasing symbolic similarity or decreasing similarity at the letter level, so that those hits which have a higher symbolic similarity to the best hit are higher in the hit list than those hits which have a lower symbolic similarity to the best hit.
Gemäß einer weiteren erfindungsgemäßen Ausführungsform wird der Trefferliste zusätzlich eine oder mehrere weitere Wortgruppen hinzugefügt, welche eine möglichst geringe Levenshtein-Distanz von dem besten Treffer aufweisen. Dabei kann/können diese eine oder diese mehreren weiteren Wortgruppen in einer vorab bestimmten Wortgruppenmenge enthalten sein, welche auch den besten Treffer umfasst.According to a further embodiment of the invention, one or more additional word groups are added to the hit list, which have the smallest possible Levenshtein distance from the best hit. These one or more additional word groups can be contained within a predefined set of word groups, which also includes the best hit.
Mit anderen Worten werden bei dieser Ausführungsform weitere Elemente der Trefferliste hinzugefügt, ohne dass dazu die Spracherkennung eingesetzt wird. Ausgehend von dem besten Treffer, welcher über die Spracherkennung bestimmt wird, werden dabei weitere Wortgruppen bestimmt, welche eine möglichst kleine Levenshtein-Distanz von dem besten Treffer aufweisen. Um dabei nicht völlig unsinnige Wortgruppen zu erzeugen, kann das Verfahren derart eingeschränkt werden, dass vorab eine bestimmte Wortgruppenmenge festgelegt wird (beispielsweise alle Ortsnamen innerhalb einer bestimmten Region), aus welcher die weiteren Wortgruppen entnommen werden müssen.In other words, this embodiment adds further elements to the hit list without using speech recognition. Starting with the best match, which is determined via speech recognition, further word groups are identified that have the smallest possible Levenshtein distance from the best match. To avoid generating completely nonsensical word groups, the procedure can be restricted by predefining a specific set of word groups (for example, all place names within a particular region) from which the further word groups must be drawn.
Im Rahmen der vorliegenden Erfindung wird auch eine Vorrichtung zur Erzeugung einer Trefferliste bei einer automatischen Spracherkennung bereitgestellt. Dabei umfasst die Vorrichtung Erfassungsmittel (beispielsweise ein Mikrofon), um eine gesprochene Wortgruppe zu erfassen, Spracherkennungsmittel, um ausgehend von der gesprochenen Wortgruppe eine Spracherkennung durchzuführen, und Ausgabemittel (z.B. einen Monitor), um die mittels der Spracherkennung erzeugte Trefferliste auszugeben oder darzustellen. Dabei erzeugen die Spracherkennungsmittel die Trefferliste, indem ausgehend von der gesprochenen Wortgruppe mindestens eine Trefferlisten-Wortgruppe als Treffer der Spracherkennung bestimmt wird. Quasi als Zwischenschritt ermitteln die Spracherkennungsmittel mindestens eine Ausgangs-Wortgruppe, indem die Spracherkennungsmittel abhängig von der gesprochenen Wortgruppe die Spracherkennung durchführen. Mittels des Levenshtein-Verfahrens wird ausgehend von dieser mindestens einen Ausgangs-Wortgruppe die Trefferliste erzeugt, welche die mindestens eine Ausgangs-Wortgruppe umfasst.Within the scope of the present invention, a device for generating a hit list in automatic speech recognition is also provided. The device comprises acquisition means (e.g., a microphone) for capturing a spoken word group, speech recognition means for performing speech recognition based on the spoken word group, and output means (e.g., a monitor) for outputting or displaying the hit list generated by the speech recognition. The speech recognition means generate the hit list by determining at least one hit list word group as a speech recognition hit, starting from the spoken word group. As an intermediate step, the speech recognition means determine at least one source word group by performing speech recognition based on the spoken word group. Using the Levenshtein method, the hit list, which includes this at least one source word group, is generated based on this at least one source word group.
Die Vorteile der erfindungsgemäßen Vorrichtung entsprechen im Wesentlichen den Vorteilen des erfindungsgemäßen Verfahrens, weshalb hier auf eine Wiederholung verzichtet wird.The advantages of the device according to the invention essentially correspond to the advantages of the method according to the invention, which is why a repetition is omitted here.
Schließlich wird im Rahmen der vorliegenden Erfindung ein Fahrzeug bereitgestellt, welches eine erfindungsgemäße Vorrichtung umfasst.Finally, within the scope of the present invention, a vehicle is provided which includes a device according to the invention.
Die vorliegende Erfindung ist insbesondere für die Erzeugung von Sprachbefehlen oder für die Vorgabe von Ortsnamen oder Adressen beispielsweise bei einem Navigationssystem geeignet. Selbstverständlich ist die vorliegende Erfindung nicht auf diesen bevorzugten Anwendungsbereich beschränkt, sondern kann beispielsweise auch bei allgemeinen Diktiersystemen eingesetzt werden.The present invention is particularly suitable for generating voice commands or for specifying place names or addresses, for example in a navigation system. Of course, the present invention is not limited to this preferred area of application, but can also be used, for example, in general dictation systems.
Im Folgenden werden das Levenshtein-Verfahren und erfindungsgemäße Ausführungsformen mit Bezug zu den beigefügten Figuren im Detail erläutert.The Levenshtein process and embodiments according to the invention are explained in detail below with reference to the accompanying figures.
In
In
Die Levenshtein-Distanz, welche bisweilen auch als Edit-Distanz, Editierdistanz oder Editierabstand bezeichnet wird, gibt in der Informationstheorie ein Maß für den Unterschied zwischen zwei Zeichenketten (Wortgruppen) bezüglich der minimalen Anzahl der Operationen „Einfügen“, „Löschen“ und „Ersetzen“ an, um die eine der zwei Zeichenketten in die andere der zwei Zeichenketten zu überführen. Die Levenshtein-Distanz trägt ihren Namen nach dem russischen Wissenschaftler Wladimir Levenshtein, der die Levenshtein-Distanz 1965 einführte.The Levenshtein distance, sometimes also called edit distance, edit interval, or edit range, is a measure in information theory of the difference between two strings (word groups) with respect to the minimum number of insert, delete, and replace operations required to transform one string into the other. The Levenshtein distance is named after the Russian scientist Vladimir Levenshtein, who introduced it in 1965.
Um beispielsweise von der Zeichenkette „Tier“ zu der Zeichenkette „Tor“ zu kommen, ist eine Ersetzung und eine Löschung notwendig, so dass die Levenshtein- Distanz demnach 2 beträgt, wie man an unten dargestelltem Vorgehen sieht:
- 1. Tier
- 2. Toer (Ersetze i durch o)
- 3. Tor (Lösche e)
- 1. Animal
- 2. Toer (Replace i with o)
- 3rd Gate (Delete e)
Im Folgenden wird ein Algorithmus beschrieben, um die Levenshtein-Distanz zwischen zwei Zeichenketten oder Wortgruppen zu bestimmen.The following describes an algorithm to determine the Levenshtein distance between two strings or groups of words.
Dieser Algorithmus berechnet die Levenshtein-Distanz mittels einer Matrix der Form (n + 1) × (m + 1), wobei n und m jeweils die Länge der zu vergleichenden Zeichenketten sind. Dabei wird die eine Zeichenkette quasi in die -1-te Zeile der Matrix und die andere Zeichenkette in die -1-te Spalte der Matrix, jeweils mit einem führenden Leerzeichen „" (hier ε genannt) geschrieben, wie es unten in Tabelle 1 dargestellt ist.This algorithm calculates the Levenshtein distance using a matrix of the form (n + 1) × (m + 1), where n and m are the lengths of the strings to be compared. One string is written into the first row of the matrix and the other into the first column, each with a leading space (here called ε), as shown in Table 1 below.
Das Element D0,0, welches in der 0-ten Spalte und in der 0-ten Zeile der Matrix liegt, weist per Definition den Wert 0 auf, d.h. D0,0 = 0.The element D 0,0 , which lies in the 0th column and in the 0th row of the matrix, has by definition the value 0, i.e. D 0,0 = 0.
Für alle anderen Elemente der Matrix gilt folgende Vorschrift:
Somit ergibt sich folgende Tabelle 1: Tabelle 1
In der oben dargestellten Tabelle ist die eigentliche Matrix, welche die Elemente Di,j enthält, extra mittels der dicken Linie gekennzeichnet. Die Matrix kann beispielsweise von der oberen linken Ecke (D0,0) zu der unteren rechten Ecke (D4,3) gefüllt werden, wobei mit D0,0 = 0 begonnen wird, wie es oben definiert ist. Der Wert eines Elements Di,j wird dabei abhängig von seinem linken Nachbarelement Di,j-1, seinem oberen Nachbarelement Di-1,j und seinem linken oberen diagonalen Nachbarelement Di-1,j-1 berechnet. Dabei wird der Wert des Elements mit einer Ausnahme dadurch bestimmt, dass das Minimum aus dem Wert seines linken Nachbarelements, aus dem Wert seines oberen Nachbarelements und aus dem Wert seines linken oberen diagonalen Nachbarelements bestimmt wird und dieses Minimum um 1 erhöht wird. Nur wenn der Wert des linken oberen diagonalen Nachbarelements gleich diesem Minimum ist und gleichzeitig das der Position des Elements entsprechende Zeichen in den beiden Zeichenketten gleich ist, entspricht der Wert des Elements dem Wert seines linken oberen diagonalen Nachbarelements.In the table above, the actual matrix containing the elements D <sub>i,j</sub> is marked with a thick line. The matrix can be filled, for example, from the upper left corner (D <sub>0,0 </sub>) to the lower right corner (D<sub>4,3</sub> ), starting with D <sub>0,0</sub> = 0, as defined above. The value of an element D<sub>i,j</sub> is calculated based on its left neighbor D<sub>i,j-1</sub> , its upper neighbor D<sub>i-1,j</sub>, and its upper left diagonal neighbor D <sub>i-1,j-1</sub> . With one exception, the element's value is determined by finding the minimum of the value of its left neighbor, its upper neighbor, and its upper left diagonal neighbor, and then increasing this minimum by 1. Only if the value of the upper left diagonal neighbor equals this minimum, and simultaneously the character corresponding to the element's position in the two strings is the same, does the element's value equal the value of its upper left diagonal neighbor.
Im Folgenden ist ein Pseudocode eines Algorithmus zur Bestimmung der Levenshtein-Distanz angeben, wobei diesem Algorithmus mittels s eine erste Zeichenkette der Länge n und mittels t eine zweite Zeichenkette der Länge m vorgegeben wird und der Algorithmus die Levenshtein-Distanz dieser beiden Zeichenketten zurückgibt:
int Levenshtein-Distanz(char s[1..n], char t[1..m])
declare int D[0..n, 0..m]
declare int i, j, cost
for i : = 0 to n
D[i,0] := i
for j :0 1 to n
D[0,j] := j
for i := 1 to n
for j := 1 to m
if s[i] = t[j] then cost := 0
else cost := 1
D[i,j] := minimum( D[i-1,j] + 1, // Einfügen
D[i, j-1]+ 1, // Löschen
D[i-1,j-1] + cost // Ersetzen
return d[n,m] The following is pseudocode for an algorithm to determine the Levenshtein distance, where this algorithm is given a first string of length n by means of s and a second string of length m by means of t, and the algorithm returns the Levenshtein distance of these two strings: int Levenshtein distance(char s[1..n], char t[1..m])
declare int D[0..n, 0..m]
declare int i, j, cost
for i := 0 to n
D[i,0] := i
for j :0 1 to n
D[0,j] := j
for i := 1 to n
for j := 1 to m
if s[i] = t[j] then cost := 0
else cost := 1
D[i,j] := minimum( D[i-1,j] + 1, // Insertion
D[i, j-1]+ 1, // Delete
D[i-1,j-1] + cost // Replace
return d[n,m]
In
Mit dem Bezugszeichen 6 ist die Trefferliste gekennzeichnet, bei welcher die einzelnen Elemente der Trefferliste gemäß der Erkennerkriterien sortiert sind, wie es nach dem Stand der Technik der Fall ist. Mit dem Bezugszeichen 7 ist eine erfindungsgemäß erzeugte Trefferliste gekennzeichnet, wobei die einzelnen Elemente der Trefferliste nach absteigender Levenshtein-Distanz zum besten Treffer, welcher oben in der Trefferliste steht, sortiert sind. Zum besseren Verständnis ist dabei in der Trefferliste 7 die Levenshtein-Distanz in Klammern angegeben.Reference numeral 6 designates the hit list in which the individual elements of the hit list are sorted according to the recognition criteria, as is the case according to the prior art. Reference numeral 7 designates a hit list generated according to the invention, wherein the individual elements of the hit list are sorted in descending order of Levenshtein distance to the best hit, which is at the top of the hit list. For better understanding, the Levenshtein distance is given in parentheses in hit list 7.
Man erkennt, dass die Wortgruppe oder besser das Wort „Beatles“ eine größere symbolische Ähnlichkeit mit dem Wort „Eagles“ aufweist, als mit dem Wort „B-52s“, weshalb das Wort „Eagles“ bei der erfindungsgemäßen Trefferliste 7 an zweiter Stelle steht, während bei der Trefferliste 6 nach dem Stand der Technik das Wort „B-52s“ an zweiter Stelle steht, welches unter den Elementen der Trefferliste die geringste symbolische Ähnlichkeit mit dem besten Treffer „Beatles“ aufweist.It can be seen that the phrase or rather the word “Beatles” has a greater symbolic similarity to the word “Eagles” than to the word “B-52s”, which is why the word “Eagles” is in second place in the hit list 7 according to the invention, whereas in the hit list 6 according to the prior art the word “B-52s” is in second place, which has the least symbolic similarity among the elements of the hit list to the best hit “Beatles”.
In
BezugszeichenlisteReference symbol list
- 11
- Vorrichtungdevice
- 22
- Mikroprozessormicroprocessor
- 33
- Mikrophonmicrophone
- 44
- AnzeigeAdvertisement
- 55
- SpracherkennungSpeech recognition
- 66
- Trefferliste sortiert nach ErkennerkriterienHit list sorted by recognition criteria
- 77
- Trefferliste sortiert nach Levenshtein-DistanzResults sorted by Levenshtein distance
- 1010
- Fahrzeugvehicle
Claims (7)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102008062923.5A DE102008062923B4 (en) | 2008-12-23 | 2008-12-23 | Method and device for generating a hit list in automatic speech recognition |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102008062923.5A DE102008062923B4 (en) | 2008-12-23 | 2008-12-23 | Method and device for generating a hit list in automatic speech recognition |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| DE102008062923A1 DE102008062923A1 (en) | 2010-06-24 |
| DE102008062923B4 true DE102008062923B4 (en) | 2025-11-06 |
Family
ID=42194075
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE102008062923.5A Active DE102008062923B4 (en) | 2008-12-23 | 2008-12-23 | Method and device for generating a hit list in automatic speech recognition |
Country Status (1)
| Country | Link |
|---|---|
| DE (1) | DE102008062923B4 (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE102011116460A1 (en) | 2011-10-20 | 2013-04-25 | Volkswagen Aktiengesellschaft | Method for providing user interface of e.g. navigation system for passenger car, involves outputting confirmation to user according to user inputs, where confirmation comprises non specific confirmation independent of word portion group |
| CN104021786B (en) * | 2014-05-15 | 2017-05-24 | 北京中科汇联信息技术有限公司 | Speech recognition method and speech recognition device |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE19933524A1 (en) * | 1999-07-16 | 2001-01-18 | Nokia Mobile Phones Ltd | Procedure for entering data into a system |
| DE10308611A1 (en) * | 2003-02-27 | 2004-09-16 | Siemens Ag | Determination of the likelihood of confusion between vocabulary entries in phoneme-based speech recognition |
| DE102004055230B3 (en) * | 2004-11-16 | 2006-07-20 | Siemens Ag | Method for speech recognition from a predefinable vocabulary |
| US20060190252A1 (en) * | 2003-02-11 | 2006-08-24 | Bradford Starkie | System for predicting speech recognition accuracy and development for a dialog system |
| DE102005018174A1 (en) * | 2005-04-19 | 2006-11-02 | Daimlerchrysler Ag | Method for the targeted determination of a complete input data record in a speech dialogue 11 |
| EP1739655A2 (en) * | 2005-06-29 | 2007-01-03 | Siemens Aktiengesellschaft | Method for determining a list of hypotheses from the vocabulary of a speech recognition system |
| DE102007028235A1 (en) * | 2007-06-20 | 2008-12-24 | Siemens Ag | Method for determining a list of hypotheses from a vocabulary of a speech recognition system |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6393395B1 (en) | 1999-01-07 | 2002-05-21 | Microsoft Corporation | Handwriting and speech recognizer using neural network with separate start and continuation output scores |
| DE10244722A1 (en) | 2002-09-25 | 2004-04-08 | Infineon Technologies Ag | Method and device for computer-aided comparison of a first sequence of spoken units with a second sequence of spoken units, speech recognition device and speech synthesis device |
| US7386441B2 (en) | 2003-11-14 | 2008-06-10 | Xerox Corporation | Method and apparatus for processing natural language using auto-intersection |
-
2008
- 2008-12-23 DE DE102008062923.5A patent/DE102008062923B4/en active Active
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE19933524A1 (en) * | 1999-07-16 | 2001-01-18 | Nokia Mobile Phones Ltd | Procedure for entering data into a system |
| US20060190252A1 (en) * | 2003-02-11 | 2006-08-24 | Bradford Starkie | System for predicting speech recognition accuracy and development for a dialog system |
| DE10308611A1 (en) * | 2003-02-27 | 2004-09-16 | Siemens Ag | Determination of the likelihood of confusion between vocabulary entries in phoneme-based speech recognition |
| DE102004055230B3 (en) * | 2004-11-16 | 2006-07-20 | Siemens Ag | Method for speech recognition from a predefinable vocabulary |
| DE102005018174A1 (en) * | 2005-04-19 | 2006-11-02 | Daimlerchrysler Ag | Method for the targeted determination of a complete input data record in a speech dialogue 11 |
| EP1739655A2 (en) * | 2005-06-29 | 2007-01-03 | Siemens Aktiengesellschaft | Method for determining a list of hypotheses from the vocabulary of a speech recognition system |
| DE102007028235A1 (en) * | 2007-06-20 | 2008-12-24 | Siemens Ag | Method for determining a list of hypotheses from a vocabulary of a speech recognition system |
Also Published As
| Publication number | Publication date |
|---|---|
| DE102008062923A1 (en) | 2010-06-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE102020205786B4 (en) | SPEECH RECOGNITION USING NLU (NATURAL LANGUAGE UNDERSTANDING) RELATED KNOWLEDGE OF DEEP FORWARD NEURAL NETWORKS | |
| DE69937176T2 (en) | Segmentation method to extend the active vocabulary of speech recognizers | |
| DE69622565T2 (en) | METHOD AND DEVICE FOR DYNAMICALLY ADJUSTING A LARGE VOCABULARY LANGUAGE IDENTIFICATION SYSTEM AND USING RESTRICTIONS FROM A DATABASE IN A VOICE LABELING LANGUAGE IDENTIFICATION SYSTEM | |
| DE69807091T2 (en) | SYSTEM AND METHOD FOR CREATING LANGUAGE GRAMMAR | |
| DE69938374T2 (en) | Method and apparatus for speech recognition using both a neural network and hidden Markov models | |
| EP1793371B1 (en) | Speech recognition method | |
| EP0797185B1 (en) | Method and device for speech recognition | |
| EP1611568B1 (en) | Three-stage word recognition | |
| DE102015213715A1 (en) | Speech recognition device and speech recognition method | |
| EP1085499A2 (en) | Spelled mode speech recognition | |
| DE69819438T2 (en) | Speech recognition method | |
| EP1264302A1 (en) | Device and method for the speech input of a destination into a destination guiding system by means of a defined input dialogue | |
| EP1884924A1 (en) | Method for creating a context-based voice dialogue output in a voice dialogue system | |
| EP0285221A2 (en) | Method for detecting continually pronounced words | |
| EP1182646A2 (en) | Classification method of phonemes | |
| DE102008062923B4 (en) | Method and device for generating a hit list in automatic speech recognition | |
| EP1125278B1 (en) | Data processing system or communications terminal with a device for recognising speech and method for recognising certain acoustic objects | |
| DE112014007207B4 (en) | Information presentation system | |
| EP0813734B1 (en) | Method of recognising at least one defined pattern modelled using hidden markov models in a time-variable test signal on which at least one interference signal is superimposed | |
| EP2034472A1 (en) | Speech recognition method and device | |
| DE60201907T2 (en) | PRESENTATION OF A COMPRESSED LIST FOR LANGUAGE-CONTROLLED USER INTERFACES | |
| EP1400951B1 (en) | Method for computerized speech recognition, a speech recognition system and a control system for controlling a technical system and telecommunication system | |
| DE102005030965B4 (en) | Extension of the dynamic vocabulary of a speech recognition system by further voice enrollments | |
| DE19824450C2 (en) | Method and device for processing speech signals | |
| DE10302101A1 (en) | Training of a Hidden Markov Model using training data vectors and a nearest neighbor clustering method based on condition parameters used to describe the Hidden Markov Model |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| OM8 | Search report available as to paragraph 43 lit. 1 sentence 1 patent law | ||
| R012 | Request for examination validly filed | ||
| R016 | Response to examination communication | ||
| R082 | Change of representative | ||
| R018 | Grant decision by examination section/examining division |