[go: up one dir, main page]

DE2020753A1 - Einrichtung zum Erkennen vorgegebener Sprachlaute - Google Patents

Einrichtung zum Erkennen vorgegebener Sprachlaute

Info

Publication number
DE2020753A1
DE2020753A1 DE19702020753 DE2020753A DE2020753A1 DE 2020753 A1 DE2020753 A1 DE 2020753A1 DE 19702020753 DE19702020753 DE 19702020753 DE 2020753 A DE2020753 A DE 2020753A DE 2020753 A1 DE2020753 A1 DE 2020753A1
Authority
DE
Germany
Prior art keywords
signals
circuit
sum
ratio
amplitudes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE19702020753
Other languages
English (en)
Inventor
Herscher Marvin Bernard
Martin Thoms Brooks
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
RCA Corp
Original Assignee
RCA Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by RCA Corp filed Critical RCA Corp
Publication of DE2020753A1 publication Critical patent/DE2020753A1/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

6963-70/Dr.ν.Β/Ε
RCA 62,121
U.S.Ser.Ho. 846,035
Filed: July 30, I969
RCA Corporation
New York N.y. (V.St.A.)
Einrichtung zum Erkennen vorgegebener Sprachlaute
Die vorliegende Erfindung betrifft eine Einrichtung zum Erkennen vorgegebener Sprachlaute aufgrund ihrer Spektralcharakteristik, mit einem Spektrumanalysator zum Erzeugen von mindestens η Spektralschwingungssignalen, die das Amplituden-Frequenz-Spektrum der Sprachlaute darstellen und jeweils den Signalschwingungen in einem bestimmten Frequenzbereich des Spektrums entsprechen.
Die bisherigen Versuche, Sprache maschinell zu erkennen, bewegen sich in zwei Richtungen. Einerseits hat man sich nämlich auf die Bestimmung der Lage der Formanten im Spektrum der Sprechlaute konzentriert. Ein Formant ist definitionsgemäß eine Spitze oder ein Maximum in der Hüllkurve des Amplituden-Frequenzspektrums des betreffenden Sprachlautes. Das Problem bei diesem Lösungsversuch besteht darin, daß die FormantStruktur,also Lage; und Amplituden der Formanten, von Sprecher zu Sprecher verschieden sind. Die bekannten Formantstruktur-Spracherkennungsgeräte liefern daher ungenügende Erkennungsquoten, wenn sie von mehr, als einem Sprecher benutzt werden oder wenn die örtlichen Ver-
hältnisse, ζ. B. die Nebengeräusche, nicht vorherbestinxibar sind.
Der zweite wesentliche Weg zur Lösung des Problems der maschinellen Spracherkennung hat sich auf die ilachbildunc oder oi — mulation der Spracherkennung beim Menschen konzentriert. Die Sprache kann als Folge von unveränderlichen Frequenzspektren und 3pektrumübergängen angesehen werden. Beim Sprechen ergeben die verschiedenen Stellungen der Zunge, Lippen und des Kachens verschiedene Formen des Stimmtraktes. Bei jeder Form des Stimmtraktes wird ein spezielles Frequenzspektrum erzeugt und jede Änderung der Form des Stimmtraktes führt zu einem spektralen übergang. Stimmharte Laute werden durch die Schwingungen der Stimmbänder erzielt und Geräuschlaute entstehen durch die über die Ränder der Zähne strömende Luft und durch teilweises Schließen der Stimmbänder. Um die natürlichen Vorgänge der Spracherkennung nachzubilden, müssen alle oben erwähnten akustischen Vorgänge sprachlichen und semantischen Prozessen zugeordnet v/erden. Das Problem einer iJachbildung der Spracnerkennung beim Menschen ist daher außerordentlih verwickelt, und die entsprechenden Lösungsversuche waren daher' nicht sehr erfolgreich.
Der vorliegenden Erfindung liegt die Aufgabe zugrunde, diese Nachteile zu vermeiden.
Bei der vorliegenden Spracherkennungseinrichtung werden bestimmte Eingangs-Sprachlaute aufgrund ihres Amplituden-Frequenz-Spektrums erkannt. Es wird das Amplituden-Frequenz-Sprektrum der Eingangs-Sprachlaute erzeugt und Spektralschwingungssignale v/erden extrahiert, die die Amplitudenpegel der Küllkurve des Spektrums in vorgegebenen Frequenzbereichen darstellen.
Die erhaltenen Spektralschwingungssignale werden in einer Breite-Schrägen-Identifizierungsanordnung verarbeitet, die Schwingungssignale liefert, welche breite positive und breite negative Schrägen odejr^J^&gunjgsn ^n bestimmten Bereichen der Hüllkurve des. Eingangs-Sprachlautsspektrums identifizieren.
009887/1304 bad
Die extrahierten Gprektralschwingungssignale werden außerdeia den ^ingancskleinnen von Anordnungen zur Bestimmung von Energieveraiiltnissen zugeführt, die entsprechende Merkmalsignale liefern, -de 3o erzeugten lJnergieverhältnis-Merkmalsignale entsprechen den Verhaltnissen von Summen der Amplituden von ausgewählten .;pektral3chwingungs Signalen zu den Summen der Amplituden von ärmeren ausgewählten Spektralschwingungssignalen.
Ferner werden Merkmalsignale erzeugt, die dem Schrägen- oder —eigungsverhältnis entsprechen. Die Schrägenverhältnis-Merk· malui^nale entsprechen den Verhältnissen von Summen der Amplituden von bestimmten Breite-Schrägen-Merkmalsignalen zu Summen eier Amplituden von vorgegebenen anderen Breite-Schrägen-Merkmal-
Die Breite-Schrägen-Merkmalsignale, die Energieverhältnis-..erkr.alsignale und die Schrägenverhältnis-Merkmalsignale werden üen- iiincan^sklerimen einer Sprachlauterkennungseinrichtung zugei'a-irt. Jie Jprachlauterkennungseinrichtung stellt fest, welcher der vorbegebenen Sprachlaute vorliegt, und liefert ein entsprec.ienäes Ausgancssignal.
AusfUhruncsbeispiele der Erfindung werden im folgenden anhand ier Zeichnung näher erläutert, es zeigen:
Fig. 1 das Anplituden/Frequenzsprektrum öines typischen ^ingangs-^pracnlautes;
' Fis. 2 ein Blockschaltbild einer Spracherkennungseinrichtung senüS einer, Ausfuhrun^sbeispiel der Erfindung;
Fig. 3 ein Blockschaltbild einer Breite/Schrägen-Erkennriclitun-g für die Spracherkennungseinrichtung gena.^ Fig.
BAD ORKäWAL 009887/13Oi
Fig. H ein Blockschaltbild einer Energieverhältnisbestimraungsscnaltung für die Spracherkennungseinrichtung gemäß Fig. 2;
Fig· 5 ein Blockschaltbild einer Schrägenverhältnis-Best immungsschaltung für die Spracherkennungseinrichtung gemäß Fig. 2;
Fig. 6 ein Schaltbild eines Vokalklassenerkenners für die Spracherkennungseinricntung gemäß Fig. 2, und
Fig. 7 ein Schaltbild eines Grundmerkmalerkenners für die Spracherkennungseinrichtung gemäß Fig. 2.
Der Erfindungsgedanke beruht auf der Klassifizierung der Sprachlaute in einer hierarchischen Ordnung. Die Hierarchie umfaßt drei Grundtypen von Spektralmerkmalen: Breiteklassen-Merknale, Gemeinsame Grundmerkmale und eindeutige Phonemrnerkmale. Die Breiteklassen-Ilerkmale sind Merkmale, die verhältnismäßig unempfindlich gegen örtliche Geräusche sind und sie stellen unter Umständen die einzige Information dar, die bei schlechten Übermittlungsverhältnissen zur Verfügung steht. Beispiele von Breiteklassen-Merkmalen sind Vokale und vokalartige Laute, stimmhafte geräuschähnliche Konsonanten, stimmlose geräuschähnliche Konsonanten, kurze Zwischenräume, Pausen und Energiebündel oder -ausbrüche. Gemeinsame Grundmerkmäle sind diejenigen Laute, die sehr ähnlichen Phonemen gemeinsam sind, jedoch nicht, zur Unterscheidung dieser Phoneme dienen. Beispiele von . gemeinsamen Grundmerkmalen sind /f,s/ und /l,m,n/.
Eindeutige Phonemmerkmale sind die sehr lokalisierten spektralen Merkmale, in denen sich verschiedene ähnliche Phoneme un-· terscheiden. Beispiele solcher eindeutiger Phonemmerkmale sind der /f/-Laut in fin und der /p/-Laut in p_in, durch die sich die beiden Wörter unterscheiden.
Die Lauterkennung und anschließend die Worterkennung er-
009887/1304
folgt durch Identifizierung der Klassenmerkmale, der gemeinsamen Grundmerkmale und der eindeutigen Phonemmerkmale. Die letztgenannten Merkmale werden durch die Breite-Schrägen-Merkmale, die Energieverhältnis-Merkmale und die Schrägenverhältnis-Merkmale der Hüllkurve des Amplituden/Frequenz-Spektrums der Eingangs-Sprachlaute identifiziert. .
Man kann mit den Absblutwerten der Energieamplitudenpegel und der Schrägen-Merkmale arbeiten, Verhältniswerte dieser Größen sind jedoch weniger empfindlich gegen Amplitudenschwankungen als die entsprechenden Absolutwerte.
Nachdem die speziellen Laute durch hierarchische Organisation erkannt worden sind, werden die entsprechenden Lautidentifizierungssignale durch eine Sequenzschal.tung der Reihe nach zusammengefügt, um das Vorliegen spezieller Wörter in der Eingangssprache festzustellen.
Die Wort-Identifizierungssignale können dann zur Anzeige und/oder zur Maschinensteuerung verwendet werden.
Bei dem in Pig. I dargestellten Amplituden/Frequenz-Spektrum stellen die senkrechten Pfeile E^ - E1J. die Amplitude von Spektralschwingungssignalen bei vorgegebenen Frequenzen im Spektrum eines typischen Sprachlautes dar. Die gestrichelte Kurve in Fig. 1 ist die Hüllkurve des Spektrums. Die Spitzen oder Maxima F1, F2 und F, der Hüllkurve werden als Formanten des Eingangs-Sprachlautes bezeichnet.
Verschiedene Eingangs-Sprachlaute werden auch eine ver- ' . schiedene Formantstruktur haben. Bei vielen bekannten Spracherkennungsgeräten erfolgt die Identifizierung der Sprachlaute in erster Linie aufgrund der Formantstruktur bzw. der Lage der Formanten. Die vorliegende Erfindung geht über die Feststellung der Lage der Formanten hinaus und zieht zur Lauterkennung die spek-
' 009887/1304
tralen Eigenschaften von breiten positiven Schrägen oder Neigungen +dE/df, breiten negativen Schrägen -dE/df, Verhältnissen von breiten Schrägen und Verhältnissen der Amplitudenpegel von Spektralschwingungen im jeweiligen Lautspektrum heran.
Die in Fig. 2 dargestellte Spracherkennungseinrichtung enthält einen Wandler IO zum Umsetzen eines Eingangs-Jprachlautes in ein zeitabhängiges elektrisches Signal. Der Wandler 10 kann ein Mikrophon sein, wenn die Einrichtung für lebende Personen bestimmt ist, oder auch ein Magnetkopf, wenn die Einrichtung zur Verarbeitung von auf Band gespeicherter Sprache dienen soll.
Das die Eingangs-Sprachlaute darstellende zeitabhängige elektrische Signal wird vom Wandler 10 über eine Leitung 11 einem Entzerrer-Vorverstärker 12 zugeführt. Dieser verstärkt das über die Leitung 11 zugeführte Signal und kompensiert gleichzeitig etwaige PrequenzverZerrungen, die durch den Wandler 10 eingeführt worden sind. Der Entzerrer-Vorverstärker 12 dient ferner als Ir.apedanzanpassungsglied zwischen dem Wandler 10 und der an den Entzerrer-Vorverstärker angeschlossenen Schaltungsanordnung.
Zur Erzeugung eines Spektrums des in Fig. 1 dargestellten Typs wird das verstärkte und entzerrte zeltabhängige Signal vom Entzerrer-Vorverstärker 12 über eine Leitung 13 vierzehn parallelgeschalteten BanÜfiltern zugeführt, die durcn einen Block 14 dargestellt sind. Die Anzahl der Bandfilter im Block 14 hängt selbstverständlich in der Praxis von den an die Einrichtung gestellten Anforderungen ab.
Jedes mit der Leitung 13 gekoppelte Bandfilter im Block liefert auf einer entsprechenden Ausgangsleitun gl5 a bis 15 η ein zeitabhängiges Ausgangssignal. Jedes dieser zeitabhängigen Ausgangssignale auf den Leitungen 15 a bis 15 η enthält denjenigen Anteil des über die Leitung 13 zugeführten Signales, der ,
QQ9SS7/1304 ***> original
in dem vom entsprechenden Bandfilter im Block lH durchgelassenen Frequenzbereich liegt.
Jedes der zeitabhängigen Signale auf den Leitungen 15 a "bis 1-3 η v/ird durch entsprechende Schaltungen in einem Block 16 für sich gleichgerichtet und durch ein Tiefpaßfilter von unerwünschter Phaseninformation befreit. Den Gleichrichter- und Filterschaltungen in Block 16 wird außer den Signalen auf den Leitungen 15 a bis 15 η auch das Signal von der Leitung 13 Über eine zeitung 17 zugeführt.· Die Ausgangssignale der Gleichrichter-Filterschaltungen imBlock 16 sind in vierzehn Bandfilter- oder Frequenzbandkanälen und einem zusätzlichen ungefilterten Kanal, der die Gesanitenergie des Spektrums darstellt, enthalten. Die fünfsehn zeitabhängigen Signale in den fünfzehn Informationskanälen werann von den Ausgangsklemmen der Gleichrichter-Filterschaltungen im Block 16 über Leitungen 13 a bis 18 ο einer.'Multiplex-schaltung 1"* zugeführt.
Die Multiplexschaltun-e 19 verschachtelt die fünfzenn zeitab>JiiiGXgen cignale auf den Leitungen 18 a bis 18 ο zu einem Signal, das üoer eine Leitung 20 der Singangsklemme eines logarithrä3C;ien Verstärkers 21 zugeführt wird. Das zeitlich verschachtelte ;."iunal auf der nit der Ausgangsklemme der Multiplexschaltung 1-J verbunaenen Leitung 20 enthält fünfzehn Zeitkanalintervalle gleicher Dauer. Jedes der zeitabhängigen Signale auf den Leitungen 18 a bis 13 ο nimmt einen der. fünfzehn Zeitkanalintervalle ein, die durcn die Multiplexschaltung 19 auf der Leitung 20 gebildet '.verden.
Der logarithmische Verstärker 21 dient zur Dynamikkompression der seitabhängigen Signale in den verschachtelten Zeitkanalintervallen auf der Leitung 20. Der durch den Verstärker 21 erzeugte Logarithmus des Multiplexsignals ermöglicht auch eine einfache Errechnung der Verhältnisse der im föultiplexsignal enthaltenen Signalanteile. Vorzugsweise wird nämlich mit Größen-
Q09$87/13tH
verhältnissen gearbeitet, da einfache Amplitudenänderungen, wie sie durch Änderungen des Verstärkungsgrades verursacht werden, keinen Einfluß auf den Verhältniswert haben. Da die Amplitude des Signales auf der mit der Ausgangsklemme des logarithmischen Verstärkers 21 verbundenen Leitung 22 der Logarithmus der verschachtelten Signale auf den Leitungen 18 a bis 18 ο ist, entspricht die Subtraktion eines Signales von einem anderen auf der Leitung 22 oder später in der Einrichtung der Bildung des Verhältnisses der beiden Signale. Die letztgenannte Operation läßt sich mathematisch wie folgt ausdrücken:
log A - log B s log g
Das Ausgangssignal des logarithmischen Verstärkers 21 wird über die Leitung 22 einer Gruppe von Schaltern 23 a bis 23 ο zugeführt. Jeder der Schalter 23 a bis 23 ο ist ein Modulofünfzehn-Schalter und wird in einer Reihe von fünfzehn aufeinanderfolgenden Zeitkanal-Intervallen einmal geschlossen und geöffnet. Die Schalter 23 a bis 23 ο trennen also die fünfzehn zeitabhängigen Signale entsprechend den logarithmischen Signalen in den fünfzehn Zeitkanalintervallen. Die Schalter 23a bis 23 ο sind jeweils mit einer entsprechenden Abgreif- und Halteschaltung 21J a bis 21J ο verbunden. Immer wenn ein Signal von einem der Schalter 23 a bis 23 ο durchgelassen wird, wird ein Amplitudenwert durch die entsprechende der Abgreif- und Halterschaltungen 24 a bis 2k ο abgegriffen. Der abgegriffene Amplitudenwert wird für fünfzehn Zeitkanalintervalle gehalten, bis der zugehörige Schalter wieder schließt und ein neuer Amplitudenwert abgegriffen und gespeichert wird. Nachdem die Signale in einem vollständigen Zyklus von fünfzehn Zeitkanalintervallen abgegriffen worden sind, liefern die Abgreif- und Halteschaltungen 2k a bis 2k O die abgegriffenen Amplitudenpegel auf Leitungen 25 a bis 25 o. Die Agegriffenen Amplitudenpegel stellen die Spektraischwingungen des Lautspektrums nach der logarithmischen Kompression dar und sind in Pig. 1 durch die senkrechten
009 887/13 0 A bad original
-9-Pfeile versinnbildlicht.
Die Spektralschwingungen auf den Leitungen 25 a bis 25 ο werden gleichzeitig den Eingangskleiranen einer Breite-Schrägen-Identifizierungsschaltung 26 (im folgenden kurz "Schrägenschäl*- tung"). und einer Energieverhältnis-Bestimmungsschaltung 27 (im folgenden kurz "Energieverhältnisschaltung") zugeführt.
Die Schrägenschaltung 26 analysiert das Amplituden/Frequenz-Spektrum des Eingangslautes entsprechend spezieller Formeln und liefert Analogsignale, die breite positive und breite negative Schrägen in ausgewählten Bereichen des AmplitudenfrequenzspektrunB darstellen und auf Leitungen 28 bis 53 zur Verfügung stehen» Auf Einzelheiten der Schrägenschaltung 26 wird noch eingegangen.
In der EnergieVerhältnisschaltung 27 werden die Amplituden vorgegebener Spektralschwingungen auf den Leitungen 25 a bis 25 ο miteinander verglichen,und es werden entsprechende Ausgangssignale auf Ausgangsleitungen 54 1 bis 54 η erzeugt. Auch diese Schaltung wird noch genauer erläutert.
Mit den Ausgangsleitungen 28 bis 53 der Schrägenschaltung ist eine Schrägen-Verhältnis-Bestimmungsschaltung 55 (im folgenden kurz "Schrägenverhältnisschaltung") gekoppelt. In der Schrägenverhältnisschaltung 55 werden vorgegebene Schrägensignale auf den Leitungen 28 bis 53 analysiert. Die Schrägenverhältnisschaltung 55 liefert Schrägenverhältnissignale auf Ausgangsleitungen 56 1 bis 56 m. Auf die Arbeitsweise der Schrägenverhältnisschaltung 55 wird ebenfalls noch eingegangen werden.
Die Schrägensignale auf den Leitungen 28 bis 53 und die Energieverhältnissignale auf den Leitungen 54 1 bis 54 n- sowie die Schrägenverhältnissignale auf den .Leitungen 56 1 bis 56 m werden den Eingangsklemmen .einer,:Lauterkennungsschaltung 57 zugeführt. Die LauterkennungsschaltMrTtg 57 enthält die erforderlichen
00 9887/1
-XO-
■ Schaltwerke und Verknüpfungsschaltung einschließlich eines Folge-.zuordners, die zur Identifizierung der jeweiligen Eingangssprachlaute erforderlich sind. Der Identifizierungsprozess ist das Ergebnis der fortgeschrittenen Kenntnisse der spektralen Eigenschaften spezieller Eingangssprachlaute. Die Lauterkennungsschaltung 67 ist auf das Vokabular, das die Spracherkennungseinrientung erkennen soll, zugeschnitten. Die den durch die Einrichtung erkannten Wörtern entsprechenden Ausgangssignale stehen auf Leitungen 58 1 bis 58 ρ zur Verfügung.
Im folgenden werden Ausführungsbeispiele verschiedener Erkennungsschaltungen erläutert.
Fig. 3 zeigt, wie breite positive und breite negative(Hüllkurven-)Schrägen bestimmt v/erden können. Die Bestimmung von breiten positiven Schrägen BPS erfolgt auf der Basis der folgenden Gleichung:
BPSn = K «En+2 + EW - (En-l + En)}
In dieser Gleichung bedeutet E die Amplitude der durch den Index η bezeichneten Spektralschwingung und K eine Konstante.
Die Identifizierung breiter negativer Schrägen BiiS erfolgt auf der Basis der folgenden Gleichung:
BMSn = K KEn.! * En) - (En)1 »
Schaltungstechnisch werden die Gleichungen zur Identifizierung der breiten positiven und breiten negativen Schrägen mit Hilfe von Operationsverstärkern realisiert, die in Fig. 3durch Einheiten 60 und 61 schematisch dargestellt sind. Diese Einheiten liefern bei geeigneter äußerer Beschaltung analoge Ausgangssignale, die proportional der Differenz zwischen der Summe der Am-
00988T/1304
plituden der Signale an lfErregungs"-Eingangsklemmen und der Summe der Amplituden der Signale an "Inhibif-Eingangskleminen.
In der Praxis werden die den Erregungs-Eingangsklemmen zugeführten Signale als Signale positiver Amplitude, und die den Inhibit-LinGangsklemmen zugeführte Signale als Signale negativer Amplitude verarbeitet.
Beispielsweise sind an die Erregungsklemmen der Einheit 60 Leitungen 62 und 63 angeschlossen, v/ährend Leitungen.61J und 65 an die Inhibitklemmen (dargestellt durch Pfeil und Kreis) der Einheit 60 angeschlossen sind. Wenn die Spektralschwingungssignale ^n+2 und Ε η+1 der Le*timß 62 bzw. 63 zugeführt werden und auf den Leitungen 64 und 65 die Spektralschwingungssignale En-1 bzw. E liefen, wird die obige Gleichung für die breite positive Schräge BPSn realisiert und auf der Ausgangsleitung 66 des OpaationsVerstärkers 60 erscheint ein Ausganessignal entsprechend EPSn. Die Kenstante ii ist der Yerstärkuncsgrad der Einheit 60. Die Einheit 60 und alle anderen Einheiten haben eine solche über tragungsfunktion, daß an ihren Ausgangsklemmen jeweils nur dann ein Analogsignal erzeugt wird, wenn das Ergebnis der Rechnirg einen positiven Wert hat.
Aus vierzehn Spektralschwingungssignalen E^ bis E^ können dreisehn breite positive Schragen errechnet werden, da bei der dreisehnten Rechnung nur das eine Spektraischi/ingungssignal E-.J. an der Erregungskleriine des zugehörigen Operationsverstärkers liegt. Un alle dreizehn breiten positiven Schrägen zu errechnen, sind dreizehn Einheiten entsprechend der Einheit 63 in Fig. 3 nötig.
In entsprechender V/eise ist die Operationsverstärkereinheit 61 repräsentativ für die Art und Weise der Erzeugung der Breite- ^egative-Schrägen-ldentifizierungssignale. Den Erregungsklenanen der Einheit Sl vferden Über Leitungen 67 und 63 die Spektral-
schwingungssignale En-1 bzw. En zugeführt, während den Inhibitklemmen über Leitungen 69 bzw. 70 die Spektraischwingungssignale E +1 bzw. Ep zugeführt werden. Das Ausgangssignal der Einheit 61 auf der Leitung 71 ist einfach die Darstellung von BWSn als Analogsignal. Auch hier werden dreizehn Rechnungen für breite negative Schrägen durchgeführt, da/Sie Errechnung von BNS.-nur noch das Spektrais chwingungs sign al E^1. an der Inhibitklemme der entsprechenden Einheit zur Verfügung steht.
Die Realisierung der Gleichungen für die breiten positiven und negativen Schrägen in dem vorliegenden System, das mit vierzehn Spektralschwingungssignalen arbeitet, erfordert dreizehn Operationsverstärker entsprechend der Einheit 60 und dreizehn Operationsverstärker entsprechend der Einheit 61. Die Ausgangssignale der Operationsverstärker sind Analogwerte , die jeweils die Differenz zwischen der Summe der Amplituden an den Erregungsklemmen und der Summe der Amplitude an den Inhibitklemmen darstellen. Diese Ausgangssignale liegen auf den Leitungen 28 bis 53.
Pig. Jj zeigt ein Ausführungsbeispiel der Energie verhält- nisbestimmungsschaltung, deren Eingangsklemmen die Spektralschwingungssignale über die Leitungen 25 a bis 25 ο zugeführt werden.
Die Spektraischwingungssignale durchlaufen eine Zwischenverbindungsmatrix 68, damit die Signale auf den Leitungen 25 a bis 25 ο mehrfach zur Verfügung stehen. Hit der Matrix 80 ist eine Anzahl von Operationsverstärkern mit Erregungs- und Inhibiteingaftgsklemmen gekoppelt. Die Operationsverstärker in der Energieverhältnissch&tung 27 haben solche Übertragungsfunktionen, daß ein quantisiertes oder genormtes Signal oder eine binäre Eins an der Ausgangsklemme des entsprechenden Operationsverstärkers auftritt, wenn die Summe der Amplitudenwerte der Signale an den Erregungsklemmen.die Summe der Amplitudenwerte der Signale an den
009887/1304
Inhibitklemmen, um einen bestimmten Schwellwertbetrag überschreiten.
Wieviele Operationsverstärkereinheiten in der Energieverhältnisschaltung 27 vorhanden sind und welche Spektralschwingungssignale den Eingangsklemmen dieser Einheiten jeweils zugeführt sind, hängt von dem Vokabular ab, für das die betreffende Spracherkennungseinheit bestimmt ist.
In Fig. 4 ist nur ein einziger Operationsverstärker 81 genauer dargestellt, der für die Operationsverstärkereinheiten in der Energieverhältnisschaltung 27 typisch ist. Den Erregungseingangsklemmen des Operationsverstärkers 81 sind über Leitungen 82, 83 und 84 die Spektralschwingungssignale E1, Ep bzw. E, zugeführt. Den Inhibitklemmen der Einheit 81 werden über Leitungen 85> 86 und 87 die Spektralschwingungssignale E1,, E1- bzw. Eg zugeführt. Wenn, die Summe der Amplituden der Spektralschwingungssignale E1, E2 und E, die Summe der Amplituden der Spektralschwingungssignale Eh, Ef- und Eg um einen Betrag überschreitet, der gleich dem für die Einheit 81 vorgegebenen Schwellwert ist, tritt auf der Ausgangsleitung 54 1 ein Ausgangssignal auf, das einer binären Eins entspricht. *
Das binäre Signal auf der Leitung 54 1 zeigt an, daß das Amplitudenniveau in dem die Spektralschwingungssignale E1 bis E, enthaltenden Bereich des Eingangsspektrums im allgemeinen größer ist als die Amplitude in dem die Spektralschwingungssignale E^ bis Eg enthaltenden Frequenzbereich. In entsprechender Weise werden auch andere Bereiche des Eingangsfrequenspektrums hinsichtlich ihrer Amplitudenpegel in der Energieverhältnisschaltung ' ■ verglichen. Die Ausgangssignale, die durch die in der Energieverhältnisschaltung 57 enthaltenen Operationsverstärker geliefert werden, stehen auf den Ausgangsleitungen 54 1 bis 54 η zur Verfügung.
Fig. 5 zeigt eine'Ausfuhrungsform für die Schrägenverhält-
0Ö9887/T304
-ih-
nisschaltung 55, die ähnlich arbeitet wie die Energieverhältnisschaltung 27 gemäß Fig. 4. Die Analogsignale, die den breiten positiven und breiten negativen Schrägen entsprechen, werden von der Schrägenschaltung 26 über die Leitungen 28 bis 53 den Eingangsklemmen der SchrägenVerhältnisschaltung 55 zugeführt. Die Schrägensignale durchlaufen dann eine Zwischenverbindungsmatrix 90, an deren Ausgangsklemmen diese Signale mehrfach zur Verfügung stehen. Mit der Matrix 90 sind Operationsverstärker gekoppelt, die die Schrägenverhältnissignale erzeugen.
Die Operationsverstärker in der Schrägenverhältnisschaltung 55 erzeugen normferte Signale großer Amplitude, wenn die Summe der Amplituden der Schrägensignale an den Erregungsklemmen des betreffenden Operationsverstärkers die Summe der Amplituden der Schrägensignale an den Inhibitklemmen des betreffenden Operationsverstärkers um einen bestimmten Schwellwertbetrag überschreitet. Bei der Schaltung gemäß Fig. 5 liefert z.B. der Operationsverstärker 91 auf der Ausgangsleitung 56 1 ein Signal entsprechend einer binären Eins, wenn die Summe der Amplituden der Schrägensignale BNS 5 und BNS 6 auf den Leitungen 92 bzw. 93 die Summe der Amplituden der Schrägensignale BNS 7 und BNS 8 auf den Leitungen 94 bzw.. 95 überschreitet. Auch hier hängen die erforderliche Anzahl der Operationsverstärker und die Art ihrer Kopplung mit der Matrix 19 von dem zu erkennenden Vokabular ab. Die binären Signale, die an den Ausgangsklemmen der Operationsverstärker in der Schrägenverhältnisschaltung 55 erzeugt werden, stehen auf den Leitungen 56 1 bis 56 m zur Verfügung.
Fig. 6 zeigt wie ein Teil der oben beschriebenen spektralen Merkmale verwendet werden. Insbesondere ist in Fig. 6 die Vokalklassenmerkmalerkennungsschaltung des Lauterkenners 57 dargestellt.
In der Vokalklassenerkennungsschaltung werden Ausgangssignale von der Schrägenschaltung 26 und der Energieverhältnisschal—
009887/1304
tung 27 verwendet. Insbesondere vird über.eine Leitung 100 von der Energieverhältnisschaltung 27 ein normiertes Energieverhältnissignal großer Amplitude zugeführt, wenn die Summen der Amplitudenwerte der Spektralschwlngungssignale E,, L·^ und E^ die Summe der Amplituden der Spektraischwingungssignale Eg, E1, und Eg v um einen vorgegebenen Schwellwertbetrag überschreitet.
Außerdem werden Schrägensignale BPS 10 bis BPS 13 von der Schrägenschaltung 26 einem UND-Glied 101 zugeführt. Der Ausgang des UUD-Gliedes 101 ist über eine Leitung 103 mit einem NICHT-Glied 102 verbunden. Wenn die Sehrägensignale BPS 10, 11, 12 und 13 einen Amplitudenwert haben, der niedriger ist als die erforderliche Schaltspannung des UND-Gliedes 101, hat das auf der Leitung 103 auftretende Ausgangssignal dieses UUD-Gliedes einen kleinen Wert. Das HICHT-Glied 102 kehrt das Signal kleiner Amplitude auf der Leitung 103 um und erzeugt auf einer Ausgangsleitung ΙΟΊ ein Signal großer Amplitude.
Die Signale großer Amplitude auf den Leitungen 100 und werden den Kingangsklemmen eines UND-Gliedes 105 Zugeführt. Wenn auf den Leitungen 100 und 10Ί gleichzeitig Signale großer Amplitude auftreten, erzeugt das UND-Glied 105 auf einer Leitung 106 ein Aus gangs signal .großer Amplitude.
Die Energieverhältnisschaltung 27 liefert außerdme auf einer Leitung 107 ein EnergieVerhältnissignal, das einen hohen Wert hat j wenn die Summe der Amplitudenwerte der Spektralschwingungssignale E1, E2 und E, die Summe der Amplitudenwerte der Spektralschwingungssignale E^, E5 und Eg um einen bestimmten . Sehwellwertbetrag Überschreitet. Die Leitungen IO6 und 107 sind mit den Eingangsklemmen eines ODER-Gliedes I08 verbunden.Wenn das Signal auf der Leitung 106 oder 107 eine große Amplitude hat, tritt auch auf einer Ausgangsleitung 109 der ODER-Gliedes 108 ein Ausgangssignal hoher Amplitude auf, das anzeigt, daß·es sich bei dem Singangslaut um einen vokalischen Laut handelt.
009887/13(K
Wenn die Signalamplitude auf der Leitung 109 einen hohen Wert annimmt, weist der analysierte Laut gewisse Merkmale der invarianten Klassenmerkmale eines vokalischen Lautes auf.
Fig. 7 zeigt ein Beispiel eines Typs von Erkennungsschaltung, wie sie zur Identifizierung eines gewöhnlichen Grundmerkmales des Eingangslautes verwendet werden kann. In Fig. 7 ist im Speziellen der Erkenner für den Laut /I/, wie er im Wort"fit" vorkommt, dargestellt.
Der Schaltung gemäß Fig. 7 wird von einer Ausgangsklemme der Schrägenverhältnisschaltung 55 über eine Leitung 120 ein normiertes Signal großer Amplitude zugeführt, wenn die 3umme der Amplituden der Schrägensignale BIiS 5 und 6 die Summe der Amplituden der Schrägensignale BNS 7 und 8 um einen vorgegebenen Schwellwertbetrag überschreitet. Das Signal großer Amplitude auf der Leitung 120 wird einer Eingangsklemme eines UND-Gliedes 121 zugeführt, das im ganzen drei Eingangsklemmen hat, von denen die beiden verbleibenden mit Leitungen 122 bzw. 123 verbunden sind. Der Leitung 122 wird das Schrägensignal BPS 1 und der Leitung 123 das negierte Schrägensignal BNS 2 zugeführt. Wenn die Signale BPS 1 und BWS 2 auf den Leitungen 122 bzw. 123 sowie das Signal auf der Leitung 120 jeweils ihren großen Amplitudenwert annehmen, tritt auf einer Leitung 124, die mit der Ausgangsklemme des UND-Gliedes 121 verbunden ist, ein Ausgangssignal hoher Amplitude auf.
Außerdem werden über Leitungen 126, 127 und 128 drei von vier Eingangsklemmen eines UND-Gliedes 125 die Schrägensignale BNS 3, 4 und 5 zugeführt. Der vierte Eingang des' UND-Gliedes 125 ist mit der Leitung 109 (siehe auch Fig. 6) verbunden, auf der ein Signal großer Amplitude auftritt, wenn der LaUt als vokalisCher Laut erkannt worden ist. Wenn an allen Eingängen des UND-Gliedes 125 Signale hoher Amplitude liegen, tritt auf einer Ausgangsleitung 126 ein Signal hoher Amplitude auf.
009887/1304 ^r
Die Ausgangsleitung 124 des UND-Gliedes 121 und die Ausgangs leitung 126 des UND-Gliedes 125 sind mit den Eingangsklemmen eines UND-Gliedes IZj. verbunden.Wenn auf den Leitungen 124 und 126 Signale hoher Amplituden liegen, tritt auf einer Ausgangsleitung 128 des UND-Gliedes 127 ein Ausgangssignal hoher Amplitude auf, das anzeigt, daß der vokalische Eingangslaut als /I/~ Laut erkannt worden ist.
Jede Einrichtung, bei der die Erfindung Anwendung findet, wird Klassenmerkmal-, Gemeinsame-Grundmerkmal- und Eindeutige-Phonem-Merkmal-Erkenner erhalten. Die Konstruktion dieser. Erkenner hängt von dem Vokabular ab, für dessen Erkennung das jeweilige System ausgelegt worden ist.
Die beschriebene Einrichtung kann an die Sprechweise bestimmter Sprecher angepaßt werden. Diese Anpassung erfolgt dann durch Betonung bestimmter Merkmale in dem vom Stimmtrakt des betreffenden Sprechers erzeugten Klangspektrum. Bei der Schaltungsahordnung gemäß Fig. 7 kann es z.B. erforderlich sein, bei einem bestimmten Sprecher die Schrägensignale BNS 4, 5 und 6 auf den Leitungen 126 bis 128 zuverwenden, um eine zuverlässige Erkennung des /!/-Lautes zu gewährleisten» .
Eine entsprechende Betonung anderer Eigenschaften des Stimi» traktes einer speziellen Person kann auch in anderen Merkmal-Erkennern der Einrichtung vorgenommen werden.
Nach der Lauterkennung werden die den erkannten Lauten entsprechenden Signale der Reihe nach zum Zwecke der Worterkennung kombiniert. Die den erkannten Wörtern entsprechenden Signale s.tehen dann an den mit den Ausgangsklemmen der Schaltung 57 2) verbundenen Leitungen 58 1 bis 5.8 ρ zur Verfugung.h-

Claims (1)

  1. Patentansprilche
    Einrichtung zum Erkennen vorgegebener Sprachlaute aufgrund ihrer Spektralcharakteristik, mit einem Spektrumanalysator zum Erzeugen von mindestens η Spelctralschwingungssignalen, die das Amplituden/Frequenz-Spektrum der Sprachlaute darstellen und jeweils den Signals chv/ingunge η in einem bestimmten Frequenzbereich des Spektrums entsprechen, dadurch gekennzeichnet, daß mit dem Spektrumanalysator (14) eine Breite-Schrägen-Erkennungsschaltung (16), in der positive und negative Schrägen in vorgegebenen Bereichen der Hüllkurve des Eingangssprachlaut-Frequenzspektrums erkannt und entsprechende Schrägensignale (auf Leitungen 28 bis 53) erzeugt werden, und eine Energieverhältnis-Erkennungsschaltung (27) zum Erzeugen von Energieverhältnissignalen (auf Leitungen 54 1 bis 54 n), die jeweils dem Verhältnis der Summe der Amplituden ausgewählter Spektralschwingungssignale (ü ) zur Summe der Amplituden ausgewählter anderer Spektralschwingungssignale entsprechen, gekoppelt sind, daß mit der Schrägenschaltung (26) eine Schrägenverhältnis-Erkennungsschaltung (55) zum Erzeugen von Schrägenverhältnissignalen (auf Leitungen 56 1 bis 56 n), die jeweils dem Verhältnis einer Summe der Amplituden von ausgewählten Schrägensignalen zur Summe der Amplituden ausgewählter anderer Schrägensignale entsprechen, gekoppelt sind und daß mit der Schrägenschaltung (26), der Energieverhältnisschaltung (27) und der Schrägenverhältnisschaltung (55) ein Lauterkenner (57) verbunden ist, der Ausgangssignale liefert, die erkannten Eingangssprachlauten entsprechen,
    2, Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß die Energieverhältnis<schaltung (27) ein Energieverhältnissign;al. an einer entsprechenden Ausgangsklemme (54 1 bis 54 n) liefert, wenn die Summe der Ampli- *■ tuden einer entsprechenden ersten Anzahl ausgewählte3? spektral-
    schwinßunßösignäle (E) die Summe der Amplituden einer entsprechenden zweiten Anzahl ausgewählter Spektralschwincungssignale um einen vorgegebenen. Schwellwertbetrag überscnreitet, und daß die ochrücenverhältnisschaltung (55) ein Schrägenverhältnissignal an einer entsprechenden Auscangsklemme ('56 1 bis 56 n) liefert, wenn die Summe der Amplituden einer entsprechenden ersten Anzahl ausgewählter Schrägensignale die Summe der Amplituden einer entsprechenden zweiten Anzahl ausgewählter Schrägensignale um einen zugehörigen vorgegebenen Schwellwertbetrag überschreitet. · ..·■'..
    3. Einrichtung nach Anspruch 1 oder 2, d a d u r c h g e k e η η zeichnet, daß der Spektrumanalysator eine Schaltung (16, 17, 18 o) zum Erzeugen eines Gesamtenergieschwincungssignales enthält, welches den Energieinhalt der Spektralschw.ingunrssignale im ganzen Bereich der vorgegebenen Frequenzen des Amplituden/Frequenzspektrums darstellt.
    k. einrichtung nach Anspruch 1, 2 oder 3» dadurch ο e k e η η ζ e i c h η e t, daß der Lauterkenner (5T) eine Lautfolgeerkennungsschaltung zur Kombination bestimmter Lauterkennunijssignale und zum Erkennen des Vorliegens bestimmter Wörter in den Eingangssprachlauten enthält.
    5. einrichtung, nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß mit dem Spektrumanalysator (IH) eine Multiplexanordnung (19) gekoppelt ist, die ein zeitlich verschachteltes Multiplexsignal- aus mindestens M Zeitkanalintervallen liefert, wobei jedes Spektralschwingungssignal ein entsprechendes Zeitkanalintervall einnimmt; daß mit der Ausgangsklemme der Multiplexanordnung (19) ein nicntlinearer Verstärker (21) gekoppelt ist, der ein Signal entsprechend dem Logarithmus des Multiplexsignales liefert; daß mit dem nichtlinearen Verstärker (21) mindestens η Abgreif- und Halteschaltuncen (2k a bis 2k o) einschließlich einer Schaltvor-
    0 098 87 /1304
    richtung (23 a bis 23 ο) gekoppelt sind, welch letztere die Ab greif- und Halteschaltungen (24 a bis 24 o) zu Zeiten, die dom Auftreten der Zeitkanalintervalle entsprechen, der Reihe nach betätigt, so daß an den Ausgangsklemmen (25a bis 25 o) mindestens η logarithmische Amplitudenniveaus zur Verfügung stenen; daß die ochrügenscnaltung (26), die zwei Sätze von Jiingangsklernmen und entsprechende Ausgangsklemmen aufweist, mit den Abgrcif- und ual-teschaltungen (24 a bis 24 o) bekoppelt ist, um eine Anzahl von Cchrügensignalen an den Ausgangsklemmen zu erzeugen, die jeweils der .Summe der logarithmiscnen Amplitudenwerte an den Kingangn-Klemmen der ersten Gruppe abzüglich der Summe der logarithmscnen ämplitudenwerte an den entsprechenden xiingangsklemmen der zweiten Gruppe entsprechen; daß die i^nergieverhältnisscnaltung (27), die zv.'ei Gruppen von Jingangskleumen und entsprechende Ausgangsklemmen aufweist, mit den Abgreif- und Halteschaltungen (24 a bin 24 o) gekoppelt ist und.an den Ausgangsklemmen Jnergieverhältnissignale liefert, wennjdie Summe der logarithmic cnen Amplituden-■werte an den entsprechenden iuingangsklemmen der ersten Gruppe abzüglich der Summe der logarithmischen Anplitudenwerte an den entsprechenden jiingangsklemmen der zweiten Gruppe einen vorgegebenen Schwellwert überschreitet; daß die Schrägenverhältnisschaltung - (55)3 die zwei Gruppe von Lingangsklemmen und entsprecnende Aus- « gangsklemmen aufweist, mit der Scnrägenscnaltung (26) gekoppelt ist und an entsprechenden Ausgangsklemmen ocnrägenverhaltnissignale liefert, wenn die Summe der Amplituden der Scnrägensignale an den entsprechenden tingangsklemmen der ersten Gruppe die Summe der Amplituden der Schrägensignale an den entsprechenden üin gangsr'.lemmen der zweiten Gruppe um einen vorgegebenen Schv/ellv:ertbetrag überscnreitet.
    6. Einrichtung nach Anspruch 3 und 5, dadurch gekennzeichnet, daß das Gesar.tenergiesignal (auf aer Leitung 18 o) eier !iultiplexanorinun'-; (15) zugeführt ist und im Ausgangssignal dor !'ultiplexanorinu-',.^ ein entsprecnendes Zeit- ::ar.alintervall e:\mi:r.r.t.
    009887/1304
    7. Einrichtung nach Anspruch 5 oder 6, d a d u r c h ge lc en η ζ e i c h η e t/ daß die Schrägenschaltung (26) eine Anordnung (60, 62 bis .66) zum Erzeugen von Breite-Positive Schrägen.-signalen (BPS) enthält, die proportional der Amplitude von Spektraischwingungssignalen (n+2) + (n+1) minus Xn-I) + (n), sowie eine Anordnung (61, 6j bis 71) zum Erzeugen von BreiteiJegative-Schrägensignalen (BNS), die proportionall den Amplituden von Spektralschwingungssignalen (n-1) + (ή) minus (n+1) + (n+2) sind, enthält.
    8, Einrichtung nach Anspruch 6, d a du r c h gekennzeichnet, daß der Lauterkenner (57) einen Lautfolgeerkenner enthält, der durch Kombination ausgewählter Lauterkennungssignale das Vorliegen bestimmter Wörter in den Eingangssprachlauten erkennt und Wortanfänge, Wortenden und Pausen in diesen durch Verarbeiten des Gesamtenergiesignals ermittelt.
    BAD ORIGINAL
    0 0 9887/130
DE19702020753 1969-07-30 1970-04-28 Einrichtung zum Erkennen vorgegebener Sprachlaute Pending DE2020753A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US84603569A 1969-07-30 1969-07-30

Publications (1)

Publication Number Publication Date
DE2020753A1 true DE2020753A1 (de) 1971-02-11

Family

ID=25296762

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19702020753 Pending DE2020753A1 (de) 1969-07-30 1970-04-28 Einrichtung zum Erkennen vorgegebener Sprachlaute

Country Status (4)

Country Link
US (1) US3588363A (de)
JP (1) JPS4919922B1 (de)
DE (1) DE2020753A1 (de)
GB (1) GB1310265A (de)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2649259A1 (de) * 1976-10-29 1978-05-03 Tekade Felten & Guilleaume Verfahren zur automatischen verarbeitung von gestoerter telefonsprache
FR2435042A1 (fr) * 1978-08-31 1980-03-28 Landis & Gyr Ag Detecteur permettant de determiner l
DE3226929A1 (de) * 1981-07-24 1983-02-10 Asulab S.A., 2502 Bienne Sprachgesteuertes geraet
DE3200645A1 (de) * 1982-01-12 1983-07-21 Matsushita Electric Works, Ltd., Kadoma, Osaka "verfahren und vorrichtung zur spracherkennung"
DE3522364A1 (de) * 1984-06-22 1986-01-09 Ricoh Co., Ltd., Tokio/Tokyo System zum erkennen von sprache
DE3639756A1 (de) * 1985-11-21 1987-06-11 Ricoh Kk Stimmspektrumsanalyseeinrichtung und -verfahren

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3755627A (en) * 1971-12-22 1973-08-28 Us Navy Programmable feature extractor and speech recognizer
GB1435779A (en) * 1972-09-21 1976-05-12 Threshold Tech Word recognition
US3855417A (en) * 1972-12-01 1974-12-17 F Fuller Method and apparatus for phonation analysis lending to valid truth/lie decisions by spectral energy region comparison
US4032710A (en) * 1975-03-10 1977-06-28 Threshold Technology, Inc. Word boundary detector for speech recognition equipment
US4038503A (en) * 1975-12-29 1977-07-26 Dialog Systems, Inc. Speech recognition apparatus
US4063031A (en) * 1976-04-19 1977-12-13 Threshold Technology, Inc. System for channel switching based on speech word versus noise detection
US4343969A (en) * 1978-10-02 1982-08-10 Trans-Data Associates Apparatus and method for articulatory speech recognition
DE3008830A1 (de) * 1980-03-07 1981-10-01 Siemens AG, 1000 Berlin und 8000 München Verfahren zum betrieb eines spracherkennungsgeraetes
US4737976A (en) * 1985-09-03 1988-04-12 Motorola, Inc. Hands-free control system for a radiotelephone
US4941178A (en) * 1986-04-01 1990-07-10 Gte Laboratories Incorporated Speech recognition using preclassification and spectral normalization
US4891602A (en) * 1987-01-07 1990-01-02 Bernard Strehler Visual/voice input recognition sensor
US5832440A (en) * 1996-06-10 1998-11-03 Dace Technology Trolling motor with remote-control system having both voice--command and manual modes
EP1286329B1 (de) * 2001-08-23 2006-03-29 Culturecom Technology (Macau) Ltd. Verfahren und Vorrichtung zur phonetischen Spracherkennung
US8346559B2 (en) * 2007-12-20 2013-01-01 Dean Enterprises, Llc Detection of conditions from sound
WO2023090218A1 (ja) 2021-11-16 2023-05-25 株式会社Ihi原動機 レシプロエンジンシステム、レシプロエンジンの運転方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2649259A1 (de) * 1976-10-29 1978-05-03 Tekade Felten & Guilleaume Verfahren zur automatischen verarbeitung von gestoerter telefonsprache
FR2435042A1 (fr) * 1978-08-31 1980-03-28 Landis & Gyr Ag Detecteur permettant de determiner l
DE3226929A1 (de) * 1981-07-24 1983-02-10 Asulab S.A., 2502 Bienne Sprachgesteuertes geraet
DE3200645A1 (de) * 1982-01-12 1983-07-21 Matsushita Electric Works, Ltd., Kadoma, Osaka "verfahren und vorrichtung zur spracherkennung"
DE3522364A1 (de) * 1984-06-22 1986-01-09 Ricoh Co., Ltd., Tokio/Tokyo System zum erkennen von sprache
DE3639756A1 (de) * 1985-11-21 1987-06-11 Ricoh Kk Stimmspektrumsanalyseeinrichtung und -verfahren

Also Published As

Publication number Publication date
US3588363A (en) 1971-06-28
GB1310265A (en) 1973-03-14
JPS4919922B1 (de) 1974-05-21

Similar Documents

Publication Publication Date Title
DE2020753A1 (de) Einrichtung zum Erkennen vorgegebener Sprachlaute
DE2918533C2 (de)
DE2613258C2 (de) Schaltungsanordnung zum Erkennen von einem oder mehreren Schlüsselworten in kontinuierlicher Sprache
DE69121312T2 (de) Geräuschsignalvorhersagevorrichtung
DE2659096C2 (de)
DE10030105A1 (de) Spracherkennungseinrichtung
DE3645118C2 (de)
DE2326517A1 (de) Verfahren und schaltungsanordnung zum erkennen von gesprochenen woertern
DE2825110A1 (de) Verfahren zur erkennung kontinuierlicher sprachsignale
DE2422028C2 (de) Schaltungsanordnung zur Identifizierung einer Formantfrequenz in einem gesprochenen Wort
DE4031638C2 (de)
DE2825082A1 (de) Verfahren zur spracherkennung
DE2753707A1 (de) Einrichtung zur erkennung des auftretens eines kommandowortes aus einer eingangssprache
DE69720134T2 (de) Spracherkenner unter Verwendung von Grundfrequenzintensitätsdaten
DE2636032C3 (de) Elektrische Schaltungsanordnung zum Extrahieren der Grundschwingungsperiode aus einem Sprachsignal
EP0508547B1 (de) Schaltungsanordnung zur Spracherkennung
DE69020736T2 (de) Wellenanalyse.
DE2720666C2 (de) Verfahren und Anordnung zur Geräuschanalyse
DE2021126A1 (de) Spracherkennungsvorrichtung
DE1206167B (de) Schaltung zur Verbesserung der Erkennbarkeit von Lauten bei der Schallanalyse
DE69025932T2 (de) Einrichtung und verfahren zum erzeugen von stabilisierten darstellungen von wellen
DE2109436A1 (de) Amphtudenregler für elektrische Signale
DE2431458A1 (de) Verfahren zur automatischen sprechererkennung
DE1422056A1 (de) Phonetische Schreibmaschine
DE1547027C3 (de) Verfahren und Anordnung zur Konsonantenbestimmung in Sprachsignalen