DE2020753A1 - Einrichtung zum Erkennen vorgegebener Sprachlaute - Google Patents
Einrichtung zum Erkennen vorgegebener SprachlauteInfo
- Publication number
- DE2020753A1 DE2020753A1 DE19702020753 DE2020753A DE2020753A1 DE 2020753 A1 DE2020753 A1 DE 2020753A1 DE 19702020753 DE19702020753 DE 19702020753 DE 2020753 A DE2020753 A DE 2020753A DE 2020753 A1 DE2020753 A1 DE 2020753A1
- Authority
- DE
- Germany
- Prior art keywords
- signals
- circuit
- sum
- ratio
- amplitudes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001228 spectrum Methods 0.000 claims abstract description 37
- 230000003595 spectral effect Effects 0.000 claims description 45
- 230000010355 oscillation Effects 0.000 claims description 32
- 238000001514 detection method Methods 0.000 claims description 5
- 238000010079 rubber tapping Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 abstract description 2
- 238000010183 spectrum analysis Methods 0.000 abstract 1
- 230000005284 excitation Effects 0.000 description 9
- 230000036962 time dependent Effects 0.000 description 7
- 230000001755 vocal effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 5
- 238000000034 method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- VPWNQTHUCYMVMZ-UHFFFAOYSA-N 4,4'-sulfonyldiphenol Chemical compound C1=CC(O)=CC=C1S(=O)(=O)C1=CC=C(O)C=C1 VPWNQTHUCYMVMZ-UHFFFAOYSA-N 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 241000183024 Populus tremula Species 0.000 description 1
- 230000037007 arousal Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- ORQBXQOJMQIAOY-UHFFFAOYSA-N nobelium Chemical compound [No] ORQBXQOJMQIAOY-UHFFFAOYSA-N 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
6963-70/Dr.ν.Β/Ε
RCA 62,121
U.S.Ser.Ho. 846,035
Filed: July 30, I969
RCA 62,121
U.S.Ser.Ho. 846,035
Filed: July 30, I969
RCA Corporation
New York N.y. (V.St.A.)
Die vorliegende Erfindung betrifft eine Einrichtung zum Erkennen
vorgegebener Sprachlaute aufgrund ihrer Spektralcharakteristik, mit einem Spektrumanalysator zum Erzeugen von mindestens
η Spektralschwingungssignalen, die das Amplituden-Frequenz-Spektrum
der Sprachlaute darstellen und jeweils den Signalschwingungen in einem bestimmten Frequenzbereich des Spektrums entsprechen.
Die bisherigen Versuche, Sprache maschinell zu erkennen,
bewegen sich in zwei Richtungen. Einerseits hat man sich nämlich auf die Bestimmung der Lage der Formanten im Spektrum der Sprechlaute
konzentriert. Ein Formant ist definitionsgemäß eine Spitze oder ein Maximum in der Hüllkurve des Amplituden-Frequenzspektrums
des betreffenden Sprachlautes. Das Problem bei diesem Lösungsversuch
besteht darin, daß die FormantStruktur,also Lage;
und Amplituden der Formanten, von Sprecher zu Sprecher verschieden
sind. Die bekannten Formantstruktur-Spracherkennungsgeräte liefern daher ungenügende Erkennungsquoten, wenn sie von mehr,
als einem Sprecher benutzt werden oder wenn die örtlichen Ver-
hältnisse, ζ. B. die Nebengeräusche, nicht vorherbestinxibar sind.
Der zweite wesentliche Weg zur Lösung des Problems der maschinellen
Spracherkennung hat sich auf die ilachbildunc oder oi —
mulation der Spracherkennung beim Menschen konzentriert. Die Sprache
kann als Folge von unveränderlichen Frequenzspektren und 3pektrumübergängen
angesehen werden. Beim Sprechen ergeben die verschiedenen Stellungen der Zunge, Lippen und des Kachens verschiedene
Formen des Stimmtraktes. Bei jeder Form des Stimmtraktes
wird ein spezielles Frequenzspektrum erzeugt und jede Änderung der Form des Stimmtraktes führt zu einem spektralen übergang.
Stimmharte Laute werden durch die Schwingungen der Stimmbänder erzielt
und Geräuschlaute entstehen durch die über die Ränder der Zähne strömende Luft und durch teilweises Schließen der Stimmbänder.
Um die natürlichen Vorgänge der Spracherkennung nachzubilden, müssen alle oben erwähnten akustischen Vorgänge sprachlichen und
semantischen Prozessen zugeordnet v/erden. Das Problem einer iJachbildung der Spracnerkennung beim Menschen ist daher außerordentlih
verwickelt, und die entsprechenden Lösungsversuche waren daher' nicht sehr erfolgreich.
Der vorliegenden Erfindung liegt die Aufgabe zugrunde, diese Nachteile zu vermeiden.
Bei der vorliegenden Spracherkennungseinrichtung werden bestimmte Eingangs-Sprachlaute aufgrund ihres Amplituden-Frequenz-Spektrums
erkannt. Es wird das Amplituden-Frequenz-Sprektrum der Eingangs-Sprachlaute erzeugt und Spektralschwingungssignale v/erden
extrahiert, die die Amplitudenpegel der Küllkurve des Spektrums in vorgegebenen Frequenzbereichen darstellen.
Die erhaltenen Spektralschwingungssignale werden in einer Breite-Schrägen-Identifizierungsanordnung verarbeitet, die Schwingungssignale
liefert, welche breite positive und breite negative Schrägen odejr^J^&gunjgsn ^n bestimmten Bereichen der Hüllkurve des.
Eingangs-Sprachlautsspektrums identifizieren.
009887/1304 bad
Die extrahierten Gprektralschwingungssignale werden außerdeia
den ^ingancskleinnen von Anordnungen zur Bestimmung von Energieveraiiltnissen
zugeführt, die entsprechende Merkmalsignale liefern,
-de 3o erzeugten lJnergieverhältnis-Merkmalsignale entsprechen
den Verhaltnissen von Summen der Amplituden von ausgewählten
.;pektral3chwingungs Signalen zu den Summen der Amplituden von
ärmeren ausgewählten Spektralschwingungssignalen.
Ferner werden Merkmalsignale erzeugt, die dem Schrägen-
oder —eigungsverhältnis entsprechen. Die Schrägenverhältnis-Merk·
malui^nale entsprechen den Verhältnissen von Summen der Amplituden von bestimmten Breite-Schrägen-Merkmalsignalen zu Summen
eier Amplituden von vorgegebenen anderen Breite-Schrägen-Merkmal-
Die Breite-Schrägen-Merkmalsignale, die Energieverhältnis-..erkr.alsignale
und die Schrägenverhältnis-Merkmalsignale werden üen- iiincan^sklerimen einer Sprachlauterkennungseinrichtung zugei'a-irt.
Jie Jprachlauterkennungseinrichtung stellt fest, welcher
der vorbegebenen Sprachlaute vorliegt, und liefert ein entsprec.ienäes
Ausgancssignal.
AusfUhruncsbeispiele der Erfindung werden im folgenden anhand
ier Zeichnung näher erläutert, es zeigen:
Fig. 1 das Anplituden/Frequenzsprektrum öines typischen
^ingangs-^pracnlautes;
' Fis. 2 ein Blockschaltbild einer Spracherkennungseinrichtung
senüS einer, Ausfuhrun^sbeispiel der Erfindung;
Fig. 3 ein Blockschaltbild einer Breite/Schrägen-Erkennriclitun-g
für die Spracherkennungseinrichtung gena.^ Fig.
BAD ORKäWAL
009887/13Oi
Fig. H ein Blockschaltbild einer Energieverhältnisbestimraungsscnaltung
für die Spracherkennungseinrichtung gemäß Fig. 2;
Fig· 5 ein Blockschaltbild einer Schrägenverhältnis-Best
immungsschaltung für die Spracherkennungseinrichtung gemäß
Fig. 2;
Fig. 6 ein Schaltbild eines Vokalklassenerkenners für die Spracherkennungseinricntung gemäß Fig. 2, und
Fig. 7 ein Schaltbild eines Grundmerkmalerkenners für die Spracherkennungseinrichtung gemäß Fig. 2.
Der Erfindungsgedanke beruht auf der Klassifizierung der Sprachlaute in einer hierarchischen Ordnung. Die Hierarchie umfaßt
drei Grundtypen von Spektralmerkmalen: Breiteklassen-Merknale,
Gemeinsame Grundmerkmale und eindeutige Phonemrnerkmale.
Die Breiteklassen-Ilerkmale sind Merkmale, die verhältnismäßig unempfindlich gegen örtliche Geräusche sind und sie stellen unter
Umständen die einzige Information dar, die bei schlechten Übermittlungsverhältnissen zur Verfügung steht. Beispiele von
Breiteklassen-Merkmalen sind Vokale und vokalartige Laute, stimmhafte geräuschähnliche Konsonanten, stimmlose geräuschähnliche
Konsonanten, kurze Zwischenräume, Pausen und Energiebündel oder
-ausbrüche. Gemeinsame Grundmerkmäle sind diejenigen Laute, die sehr ähnlichen Phonemen gemeinsam sind, jedoch nicht, zur Unterscheidung
dieser Phoneme dienen. Beispiele von . gemeinsamen Grundmerkmalen sind /f,s/ und /l,m,n/.
Eindeutige Phonemmerkmale sind die sehr lokalisierten spektralen
Merkmale, in denen sich verschiedene ähnliche Phoneme un-·
terscheiden. Beispiele solcher eindeutiger Phonemmerkmale sind der /f/-Laut in fin und der /p/-Laut in p_in, durch die sich die
beiden Wörter unterscheiden.
Die Lauterkennung und anschließend die Worterkennung er-
009887/1304
folgt durch Identifizierung der Klassenmerkmale, der gemeinsamen
Grundmerkmale und der eindeutigen Phonemmerkmale. Die letztgenannten Merkmale werden durch die Breite-Schrägen-Merkmale, die
Energieverhältnis-Merkmale und die Schrägenverhältnis-Merkmale
der Hüllkurve des Amplituden/Frequenz-Spektrums der Eingangs-Sprachlaute
identifiziert. .
Man kann mit den Absblutwerten der Energieamplitudenpegel
und der Schrägen-Merkmale arbeiten, Verhältniswerte dieser Größen
sind jedoch weniger empfindlich gegen Amplitudenschwankungen als die entsprechenden Absolutwerte.
Nachdem die speziellen Laute durch hierarchische Organisation
erkannt worden sind, werden die entsprechenden Lautidentifizierungssignale durch eine Sequenzschal.tung der Reihe nach
zusammengefügt, um das Vorliegen spezieller Wörter in der Eingangssprache festzustellen.
Die Wort-Identifizierungssignale können dann zur Anzeige
und/oder zur Maschinensteuerung verwendet werden.
Bei dem in Pig. I dargestellten Amplituden/Frequenz-Spektrum
stellen die senkrechten Pfeile E^ - E1J. die Amplitude von
Spektralschwingungssignalen bei vorgegebenen Frequenzen im Spektrum
eines typischen Sprachlautes dar. Die gestrichelte Kurve in Fig. 1 ist die Hüllkurve des Spektrums. Die Spitzen oder Maxima
F1, F2 und F, der Hüllkurve werden als Formanten des Eingangs-Sprachlautes
bezeichnet.
Verschiedene Eingangs-Sprachlaute werden auch eine ver- ' .
schiedene Formantstruktur haben. Bei vielen bekannten Spracherkennungsgeräten
erfolgt die Identifizierung der Sprachlaute in erster Linie aufgrund der Formantstruktur bzw. der Lage der Formanten. Die vorliegende Erfindung geht über die Feststellung der
Lage der Formanten hinaus und zieht zur Lauterkennung die spek-
' 009887/1304
tralen Eigenschaften von breiten positiven Schrägen oder Neigungen
+dE/df, breiten negativen Schrägen -dE/df, Verhältnissen von breiten Schrägen und Verhältnissen der Amplitudenpegel von
Spektralschwingungen im jeweiligen Lautspektrum heran.
Die in Fig. 2 dargestellte Spracherkennungseinrichtung
enthält einen Wandler IO zum Umsetzen eines Eingangs-Jprachlautes
in ein zeitabhängiges elektrisches Signal. Der Wandler 10 kann ein Mikrophon sein, wenn die Einrichtung für lebende Personen
bestimmt ist, oder auch ein Magnetkopf, wenn die Einrichtung zur Verarbeitung von auf Band gespeicherter Sprache dienen
soll.
Das die Eingangs-Sprachlaute darstellende zeitabhängige
elektrische Signal wird vom Wandler 10 über eine Leitung 11 einem Entzerrer-Vorverstärker 12 zugeführt. Dieser verstärkt das über
die Leitung 11 zugeführte Signal und kompensiert gleichzeitig etwaige PrequenzverZerrungen, die durch den Wandler 10 eingeführt
worden sind. Der Entzerrer-Vorverstärker 12 dient ferner als Ir.apedanzanpassungsglied
zwischen dem Wandler 10 und der an den Entzerrer-Vorverstärker angeschlossenen Schaltungsanordnung.
Zur Erzeugung eines Spektrums des in Fig. 1 dargestellten
Typs wird das verstärkte und entzerrte zeltabhängige Signal vom Entzerrer-Vorverstärker 12 über eine Leitung 13 vierzehn parallelgeschalteten
BanÜfiltern zugeführt, die durcn einen Block 14 dargestellt sind. Die Anzahl der Bandfilter im Block 14 hängt
selbstverständlich in der Praxis von den an die Einrichtung gestellten
Anforderungen ab.
Jedes mit der Leitung 13 gekoppelte Bandfilter im Block
liefert auf einer entsprechenden Ausgangsleitun gl5 a bis 15 η
ein zeitabhängiges Ausgangssignal. Jedes dieser zeitabhängigen
Ausgangssignale auf den Leitungen 15 a bis 15 η enthält denjenigen
Anteil des über die Leitung 13 zugeführten Signales, der ,
QQ9SS7/1304 ***>
original
in dem vom entsprechenden Bandfilter im Block lH durchgelassenen
Frequenzbereich liegt.
Jedes der zeitabhängigen Signale auf den Leitungen 15 a
"bis 1-3 η v/ird durch entsprechende Schaltungen in einem Block 16 für sich gleichgerichtet und durch ein Tiefpaßfilter von unerwünschter Phaseninformation befreit. Den Gleichrichter- und Filterschaltungen
in Block 16 wird außer den Signalen auf den Leitungen
15 a bis 15 η auch das Signal von der Leitung 13 Über eine zeitung 17 zugeführt.· Die Ausgangssignale der Gleichrichter-Filterschaltungen
imBlock 16 sind in vierzehn Bandfilter- oder Frequenzbandkanälen und einem zusätzlichen ungefilterten Kanal, der
die Gesanitenergie des Spektrums darstellt, enthalten. Die fünfsehn
zeitabhängigen Signale in den fünfzehn Informationskanälen werann von den Ausgangsklemmen der Gleichrichter-Filterschaltungen
im Block 16 über Leitungen 13 a bis 18 ο einer.'Multiplex-schaltung
1"* zugeführt.
Die Multiplexschaltun-e 19 verschachtelt die fünfzenn zeitab>JiiiGXgen
cignale auf den Leitungen 18 a bis 18 ο zu einem Signal,
das üoer eine Leitung 20 der Singangsklemme eines logarithrä3C;ien
Verstärkers 21 zugeführt wird. Das zeitlich verschachtelte
;."iunal auf der nit der Ausgangsklemme der Multiplexschaltung
1-J verbunaenen Leitung 20 enthält fünfzehn Zeitkanalintervalle
gleicher Dauer. Jedes der zeitabhängigen Signale auf den Leitungen 18 a bis 13 ο nimmt einen der. fünfzehn Zeitkanalintervalle
ein, die durcn die Multiplexschaltung 19 auf der Leitung 20
gebildet '.verden.
Der logarithmische Verstärker 21 dient zur Dynamikkompression der seitabhängigen Signale in den verschachtelten Zeitkanalintervallen
auf der Leitung 20. Der durch den Verstärker 21 erzeugte Logarithmus des Multiplexsignals ermöglicht auch eine
einfache Errechnung der Verhältnisse der im föultiplexsignal
enthaltenen Signalanteile. Vorzugsweise wird nämlich mit Größen-
Q09$87/13tH
verhältnissen gearbeitet, da einfache Amplitudenänderungen, wie
sie durch Änderungen des Verstärkungsgrades verursacht werden, keinen Einfluß auf den Verhältniswert haben. Da die Amplitude
des Signales auf der mit der Ausgangsklemme des logarithmischen Verstärkers 21 verbundenen Leitung 22 der Logarithmus der verschachtelten
Signale auf den Leitungen 18 a bis 18 ο ist, entspricht die Subtraktion eines Signales von einem anderen auf
der Leitung 22 oder später in der Einrichtung der Bildung des Verhältnisses der beiden Signale. Die letztgenannte Operation
läßt sich mathematisch wie folgt ausdrücken:
log A - log B s log g
Das Ausgangssignal des logarithmischen Verstärkers 21
wird über die Leitung 22 einer Gruppe von Schaltern 23 a bis
23 ο zugeführt. Jeder der Schalter 23 a bis 23 ο ist ein Modulofünfzehn-Schalter
und wird in einer Reihe von fünfzehn aufeinanderfolgenden Zeitkanal-Intervallen einmal geschlossen und geöffnet.
Die Schalter 23 a bis 23 ο trennen also die fünfzehn zeitabhängigen
Signale entsprechend den logarithmischen Signalen in den fünfzehn Zeitkanalintervallen. Die Schalter 23a bis 23 ο
sind jeweils mit einer entsprechenden Abgreif- und Halteschaltung
21J a bis 21J ο verbunden. Immer wenn ein Signal von einem
der Schalter 23 a bis 23 ο durchgelassen wird, wird ein Amplitudenwert durch die entsprechende der Abgreif- und Halterschaltungen
24 a bis 2k ο abgegriffen. Der abgegriffene Amplitudenwert wird für fünfzehn Zeitkanalintervalle gehalten, bis der
zugehörige Schalter wieder schließt und ein neuer Amplitudenwert abgegriffen und gespeichert wird. Nachdem die Signale in
einem vollständigen Zyklus von fünfzehn Zeitkanalintervallen abgegriffen
worden sind, liefern die Abgreif- und Halteschaltungen 2k a bis 2k O die abgegriffenen Amplitudenpegel auf Leitungen
25 a bis 25 o. Die Agegriffenen Amplitudenpegel stellen die Spektraischwingungen des Lautspektrums nach der logarithmischen
Kompression dar und sind in Pig. 1 durch die senkrechten
009 887/13 0 A bad original
-9-Pfeile
versinnbildlicht.
Die Spektralschwingungen auf den Leitungen 25 a bis 25 ο
werden gleichzeitig den Eingangskleiranen einer Breite-Schrägen-Identifizierungsschaltung
26 (im folgenden kurz "Schrägenschäl*-
tung"). und einer Energieverhältnis-Bestimmungsschaltung 27 (im
folgenden kurz "Energieverhältnisschaltung") zugeführt.
Die Schrägenschaltung 26 analysiert das Amplituden/Frequenz-Spektrum
des Eingangslautes entsprechend spezieller Formeln und
liefert Analogsignale, die breite positive und breite negative Schrägen in ausgewählten Bereichen des AmplitudenfrequenzspektrunB
darstellen und auf Leitungen 28 bis 53 zur Verfügung stehen» Auf
Einzelheiten der Schrägenschaltung 26 wird noch eingegangen.
In der EnergieVerhältnisschaltung 27 werden die Amplituden
vorgegebener Spektralschwingungen auf den Leitungen 25 a bis 25 ο
miteinander verglichen,und es werden entsprechende Ausgangssignale
auf Ausgangsleitungen 54 1 bis 54 η erzeugt. Auch diese Schaltung
wird noch genauer erläutert.
Mit den Ausgangsleitungen 28 bis 53 der Schrägenschaltung
ist eine Schrägen-Verhältnis-Bestimmungsschaltung 55 (im folgenden
kurz "Schrägenverhältnisschaltung") gekoppelt. In der Schrägenverhältnisschaltung
55 werden vorgegebene Schrägensignale auf den Leitungen 28 bis 53 analysiert. Die Schrägenverhältnisschaltung
55 liefert Schrägenverhältnissignale auf Ausgangsleitungen
56 1 bis 56 m. Auf die Arbeitsweise der Schrägenverhältnisschaltung
55 wird ebenfalls noch eingegangen werden.
Die Schrägensignale auf den Leitungen 28 bis 53 und die
Energieverhältnissignale auf den Leitungen 54 1 bis 54 n- sowie
die Schrägenverhältnissignale auf den .Leitungen 56 1 bis 56 m
werden den Eingangsklemmen .einer,:Lauterkennungsschaltung 57 zugeführt.
Die LauterkennungsschaltMrTtg 57 enthält die erforderlichen
00 9887/1
-XO-
■ Schaltwerke und Verknüpfungsschaltung einschließlich eines Folge-.zuordners,
die zur Identifizierung der jeweiligen Eingangssprachlaute erforderlich sind. Der Identifizierungsprozess ist das Ergebnis
der fortgeschrittenen Kenntnisse der spektralen Eigenschaften
spezieller Eingangssprachlaute. Die Lauterkennungsschaltung
67 ist auf das Vokabular, das die Spracherkennungseinrientung erkennen
soll, zugeschnitten. Die den durch die Einrichtung erkannten Wörtern entsprechenden Ausgangssignale stehen auf Leitungen
58 1 bis 58 ρ zur Verfügung.
Im folgenden werden Ausführungsbeispiele verschiedener Erkennungsschaltungen
erläutert.
Fig. 3 zeigt, wie breite positive und breite negative(Hüllkurven-)Schrägen
bestimmt v/erden können. Die Bestimmung von breiten positiven Schrägen BPS erfolgt auf der Basis der folgenden
Gleichung:
In dieser Gleichung bedeutet E die Amplitude der durch den Index η bezeichneten Spektralschwingung und K eine Konstante.
Die Identifizierung breiter negativer Schrägen BiiS erfolgt
auf der Basis der folgenden Gleichung:
BMSn = K KEn.! * En) - (En)1 »
Schaltungstechnisch werden die Gleichungen zur Identifizierung der breiten positiven und breiten negativen Schrägen mit
Hilfe von Operationsverstärkern realisiert, die in Fig. 3durch Einheiten 60 und 61 schematisch dargestellt sind. Diese Einheiten
liefern bei geeigneter äußerer Beschaltung analoge Ausgangssignale,
die proportional der Differenz zwischen der Summe der Am-
00988T/1304
plituden der Signale an lfErregungs"-Eingangsklemmen und der Summe der Amplituden der Signale an "Inhibif-Eingangskleminen.
In der Praxis werden die den Erregungs-Eingangsklemmen zugeführten
Signale als Signale positiver Amplitude, und die den Inhibit-LinGangsklemmen zugeführte Signale als Signale negativer
Amplitude verarbeitet.
Beispielsweise sind an die Erregungsklemmen der Einheit 60
Leitungen 62 und 63 angeschlossen, v/ährend Leitungen.61J und 65
an die Inhibitklemmen (dargestellt durch Pfeil und Kreis) der Einheit 60 angeschlossen sind. Wenn die Spektralschwingungssignale
^n+2 und Ε η+1 der Le*timß 62 bzw. 63 zugeführt werden und
auf den Leitungen 64 und 65 die Spektralschwingungssignale En-1
bzw. E liefen, wird die obige Gleichung für die breite positive
Schräge BPSn realisiert und auf der Ausgangsleitung 66 des OpaationsVerstärkers
60 erscheint ein Ausganessignal entsprechend
EPSn. Die Kenstante ii ist der Yerstärkuncsgrad der Einheit 60.
Die Einheit 60 und alle anderen Einheiten haben eine solche über tragungsfunktion, daß an ihren Ausgangsklemmen jeweils nur dann
ein Analogsignal erzeugt wird, wenn das Ergebnis der Rechnirg
einen positiven Wert hat.
Aus vierzehn Spektralschwingungssignalen E^ bis E^ können
dreisehn breite positive Schragen errechnet werden, da bei der
dreisehnten Rechnung nur das eine Spektraischi/ingungssignal E-.J.
an der Erregungskleriine des zugehörigen Operationsverstärkers
liegt. Un alle dreizehn breiten positiven Schrägen zu errechnen,
sind dreizehn Einheiten entsprechend der Einheit 63 in Fig. 3
nötig.
In entsprechender V/eise ist die Operationsverstärkereinheit 61 repräsentativ für die Art und Weise der Erzeugung der Breite-
^egative-Schrägen-ldentifizierungssignale. Den Erregungsklenanen
der Einheit Sl vferden Über Leitungen 67 und 63 die Spektral-
schwingungssignale En-1 bzw. En zugeführt, während den Inhibitklemmen
über Leitungen 69 bzw. 70 die Spektraischwingungssignale
E +1 bzw. Ep zugeführt werden. Das Ausgangssignal der Einheit
61 auf der Leitung 71 ist einfach die Darstellung von BWSn als
Analogsignal. Auch hier werden dreizehn Rechnungen für breite negative Schrägen durchgeführt, da/Sie Errechnung von BNS.-nur
noch das Spektrais chwingungs sign al E^1. an der Inhibitklemme der
entsprechenden Einheit zur Verfügung steht.
Die Realisierung der Gleichungen für die breiten positiven und negativen Schrägen in dem vorliegenden System, das mit vierzehn
Spektralschwingungssignalen arbeitet, erfordert dreizehn Operationsverstärker entsprechend der Einheit 60 und dreizehn Operationsverstärker
entsprechend der Einheit 61. Die Ausgangssignale der Operationsverstärker sind Analogwerte , die jeweils die
Differenz zwischen der Summe der Amplituden an den Erregungsklemmen
und der Summe der Amplitude an den Inhibitklemmen darstellen. Diese Ausgangssignale liegen auf den Leitungen 28 bis
53.
Pig. Jj zeigt ein Ausführungsbeispiel der Energie verhält- nisbestimmungsschaltung,
deren Eingangsklemmen die Spektralschwingungssignale
über die Leitungen 25 a bis 25 ο zugeführt werden.
Die Spektraischwingungssignale durchlaufen eine Zwischenverbindungsmatrix
68, damit die Signale auf den Leitungen 25 a bis 25 ο mehrfach zur Verfügung stehen. Hit der Matrix 80 ist
eine Anzahl von Operationsverstärkern mit Erregungs- und Inhibiteingaftgsklemmen
gekoppelt. Die Operationsverstärker in der Energieverhältnissch&tung
27 haben solche Übertragungsfunktionen, daß
ein quantisiertes oder genormtes Signal oder eine binäre Eins an der Ausgangsklemme des entsprechenden Operationsverstärkers auftritt,
wenn die Summe der Amplitudenwerte der Signale an den Erregungsklemmen.die
Summe der Amplitudenwerte der Signale an den
009887/1304
Inhibitklemmen, um einen bestimmten Schwellwertbetrag überschreiten.
Wieviele Operationsverstärkereinheiten in der Energieverhältnisschaltung
27 vorhanden sind und welche Spektralschwingungssignale den Eingangsklemmen dieser Einheiten jeweils zugeführt
sind, hängt von dem Vokabular ab, für das die betreffende Spracherkennungseinheit bestimmt ist.
In Fig. 4 ist nur ein einziger Operationsverstärker 81 genauer
dargestellt, der für die Operationsverstärkereinheiten in
der Energieverhältnisschaltung 27 typisch ist. Den Erregungseingangsklemmen
des Operationsverstärkers 81 sind über Leitungen 82,
83 und 84 die Spektralschwingungssignale E1, Ep bzw. E, zugeführt.
Den Inhibitklemmen der Einheit 81 werden über Leitungen 85> 86 und 87 die Spektralschwingungssignale E1,, E1- bzw. Eg zugeführt.
Wenn, die Summe der Amplituden der Spektralschwingungssignale
E1, E2 und E, die Summe der Amplituden der Spektralschwingungssignale
Eh, Ef- und Eg um einen Betrag überschreitet, der gleich
dem für die Einheit 81 vorgegebenen Schwellwert ist, tritt auf
der Ausgangsleitung 54 1 ein Ausgangssignal auf, das einer binären Eins entspricht. *
Das binäre Signal auf der Leitung 54 1 zeigt an, daß das
Amplitudenniveau in dem die Spektralschwingungssignale E1 bis E,
enthaltenden Bereich des Eingangsspektrums im allgemeinen größer
ist als die Amplitude in dem die Spektralschwingungssignale E^
bis Eg enthaltenden Frequenzbereich. In entsprechender Weise werden auch andere Bereiche des Eingangsfrequenspektrums hinsichtlich
ihrer Amplitudenpegel in der Energieverhältnisschaltung ' ■ verglichen. Die Ausgangssignale, die durch die in der Energieverhältnisschaltung 57 enthaltenen Operationsverstärker geliefert werden, stehen auf den Ausgangsleitungen 54 1 bis 54 η zur
Verfügung.
Fig. 5 zeigt eine'Ausfuhrungsform für die Schrägenverhält-
0Ö9887/T304
-ih-
nisschaltung 55, die ähnlich arbeitet wie die Energieverhältnisschaltung
27 gemäß Fig. 4. Die Analogsignale, die den breiten positiven und breiten negativen Schrägen entsprechen, werden von
der Schrägenschaltung 26 über die Leitungen 28 bis 53 den Eingangsklemmen
der SchrägenVerhältnisschaltung 55 zugeführt. Die
Schrägensignale durchlaufen dann eine Zwischenverbindungsmatrix 90, an deren Ausgangsklemmen diese Signale mehrfach zur Verfügung
stehen. Mit der Matrix 90 sind Operationsverstärker gekoppelt, die die Schrägenverhältnissignale erzeugen.
Die Operationsverstärker in der Schrägenverhältnisschaltung 55 erzeugen normferte Signale großer Amplitude, wenn die Summe
der Amplituden der Schrägensignale an den Erregungsklemmen
des betreffenden Operationsverstärkers die Summe der Amplituden der Schrägensignale an den Inhibitklemmen des betreffenden Operationsverstärkers
um einen bestimmten Schwellwertbetrag überschreitet. Bei der Schaltung gemäß Fig. 5 liefert z.B. der Operationsverstärker
91 auf der Ausgangsleitung 56 1 ein Signal entsprechend
einer binären Eins, wenn die Summe der Amplituden der Schrägensignale BNS 5 und BNS 6 auf den Leitungen 92 bzw. 93 die Summe
der Amplituden der Schrägensignale BNS 7 und BNS 8 auf den Leitungen 94 bzw.. 95 überschreitet. Auch hier hängen die erforderliche
Anzahl der Operationsverstärker und die Art ihrer Kopplung mit der Matrix 19 von dem zu erkennenden Vokabular ab. Die
binären Signale, die an den Ausgangsklemmen der Operationsverstärker in der Schrägenverhältnisschaltung 55 erzeugt werden,
stehen auf den Leitungen 56 1 bis 56 m zur Verfügung.
Fig. 6 zeigt wie ein Teil der oben beschriebenen spektralen
Merkmale verwendet werden. Insbesondere ist in Fig. 6 die Vokalklassenmerkmalerkennungsschaltung des Lauterkenners 57 dargestellt.
In der Vokalklassenerkennungsschaltung werden Ausgangssignale
von der Schrägenschaltung 26 und der Energieverhältnisschal—
009887/1304
tung 27 verwendet. Insbesondere vird über.eine Leitung 100 von
der Energieverhältnisschaltung 27 ein normiertes Energieverhältnissignal
großer Amplitude zugeführt, wenn die Summen der Amplitudenwerte der Spektralschwlngungssignale E,, L·^ und E^ die Summe
der Amplituden der Spektraischwingungssignale Eg, E1, und Eg v
um einen vorgegebenen Schwellwertbetrag überschreitet.
Außerdem werden Schrägensignale BPS 10 bis BPS 13 von der
Schrägenschaltung 26 einem UND-Glied 101 zugeführt. Der Ausgang
des UUD-Gliedes 101 ist über eine Leitung 103 mit einem NICHT-Glied
102 verbunden. Wenn die Sehrägensignale BPS 10, 11, 12 und
13 einen Amplitudenwert haben, der niedriger ist als die erforderliche
Schaltspannung des UND-Gliedes 101, hat das auf der Leitung
103 auftretende Ausgangssignal dieses UUD-Gliedes einen kleinen Wert. Das HICHT-Glied 102 kehrt das Signal kleiner Amplitude
auf der Leitung 103 um und erzeugt auf einer Ausgangsleitung ΙΟΊ
ein Signal großer Amplitude.
Die Signale großer Amplitude auf den Leitungen 100 und
werden den Kingangsklemmen eines UND-Gliedes 105 Zugeführt. Wenn
auf den Leitungen 100 und 10Ί gleichzeitig Signale großer Amplitude auftreten, erzeugt das UND-Glied 105 auf einer Leitung 106
ein Aus gangs signal .großer Amplitude.
Die Energieverhältnisschaltung 27 liefert außerdme auf
einer Leitung 107 ein EnergieVerhältnissignal, das einen hohen
Wert hat j wenn die Summe der Amplitudenwerte der Spektralschwingungssignale
E1, E2 und E, die Summe der Amplitudenwerte der
Spektralschwingungssignale E^, E5 und Eg um einen bestimmten
. Sehwellwertbetrag Überschreitet. Die Leitungen IO6 und 107 sind
mit den Eingangsklemmen eines ODER-Gliedes I08 verbunden.Wenn das
Signal auf der Leitung 106 oder 107 eine große Amplitude hat,
tritt auch auf einer Ausgangsleitung 109 der ODER-Gliedes 108 ein Ausgangssignal hoher Amplitude auf, das anzeigt, daß·es sich
bei dem Singangslaut um einen vokalischen Laut handelt.
009887/13(K
Wenn die Signalamplitude auf der Leitung 109 einen hohen
Wert annimmt, weist der analysierte Laut gewisse Merkmale der invarianten Klassenmerkmale eines vokalischen Lautes auf.
Fig. 7 zeigt ein Beispiel eines Typs von Erkennungsschaltung,
wie sie zur Identifizierung eines gewöhnlichen Grundmerkmales des Eingangslautes verwendet werden kann. In Fig. 7 ist
im Speziellen der Erkenner für den Laut /I/, wie er im Wort"fit" vorkommt, dargestellt.
Der Schaltung gemäß Fig. 7 wird von einer Ausgangsklemme der Schrägenverhältnisschaltung 55 über eine Leitung 120 ein
normiertes Signal großer Amplitude zugeführt, wenn die 3umme der Amplituden der Schrägensignale BIiS 5 und 6 die Summe der Amplituden
der Schrägensignale BNS 7 und 8 um einen vorgegebenen Schwellwertbetrag überschreitet. Das Signal großer Amplitude auf
der Leitung 120 wird einer Eingangsklemme eines UND-Gliedes 121 zugeführt, das im ganzen drei Eingangsklemmen hat, von denen die
beiden verbleibenden mit Leitungen 122 bzw. 123 verbunden sind. Der Leitung 122 wird das Schrägensignal BPS 1 und der Leitung
123 das negierte Schrägensignal BNS 2 zugeführt. Wenn die Signale BPS 1 und BWS 2 auf den Leitungen 122 bzw. 123 sowie das
Signal auf der Leitung 120 jeweils ihren großen Amplitudenwert annehmen, tritt auf einer Leitung 124, die mit der Ausgangsklemme
des UND-Gliedes 121 verbunden ist, ein Ausgangssignal hoher Amplitude auf.
Außerdem werden über Leitungen 126, 127 und 128 drei von vier Eingangsklemmen eines UND-Gliedes 125 die Schrägensignale
BNS 3, 4 und 5 zugeführt. Der vierte Eingang des' UND-Gliedes 125 ist mit der Leitung 109 (siehe auch Fig. 6) verbunden, auf
der ein Signal großer Amplitude auftritt, wenn der LaUt als vokalisCher
Laut erkannt worden ist. Wenn an allen Eingängen des UND-Gliedes 125 Signale hoher Amplitude liegen, tritt auf einer
Ausgangsleitung 126 ein Signal hoher Amplitude auf.
009887/1304 ^r
Die Ausgangsleitung 124 des UND-Gliedes 121 und die Ausgangs
leitung 126 des UND-Gliedes 125 sind mit den Eingangsklemmen
eines UND-Gliedes IZj. verbunden.Wenn auf den Leitungen 124
und 126 Signale hoher Amplituden liegen, tritt auf einer Ausgangsleitung
128 des UND-Gliedes 127 ein Ausgangssignal hoher Amplitude auf, das anzeigt, daß der vokalische Eingangslaut als /I/~
Laut erkannt worden ist.
Jede Einrichtung, bei der die Erfindung Anwendung findet,
wird Klassenmerkmal-, Gemeinsame-Grundmerkmal- und Eindeutige-Phonem-Merkmal-Erkenner
erhalten. Die Konstruktion dieser. Erkenner hängt von dem Vokabular ab, für dessen Erkennung das jeweilige
System ausgelegt worden ist.
Die beschriebene Einrichtung kann an die Sprechweise bestimmter Sprecher angepaßt werden. Diese Anpassung erfolgt dann
durch Betonung bestimmter Merkmale in dem vom Stimmtrakt des betreffenden
Sprechers erzeugten Klangspektrum. Bei der Schaltungsahordnung gemäß Fig. 7 kann es z.B. erforderlich sein, bei einem
bestimmten Sprecher die Schrägensignale BNS 4, 5 und 6 auf den Leitungen 126 bis 128 zuverwenden, um eine zuverlässige Erkennung
des /!/-Lautes zu gewährleisten» .
Eine entsprechende Betonung anderer Eigenschaften des Stimi»
traktes einer speziellen Person kann auch in anderen Merkmal-Erkennern
der Einrichtung vorgenommen werden.
Nach der Lauterkennung werden die den erkannten Lauten entsprechenden
Signale der Reihe nach zum Zwecke der Worterkennung kombiniert. Die den erkannten Wörtern entsprechenden Signale
s.tehen dann an den mit den Ausgangsklemmen der Schaltung 57
2) verbundenen Leitungen 58 1 bis 5.8 ρ zur Verfugung.h-
Claims (1)
- PatentansprilcheEinrichtung zum Erkennen vorgegebener Sprachlaute aufgrund ihrer Spektralcharakteristik, mit einem Spektrumanalysator zum Erzeugen von mindestens η Spelctralschwingungssignalen, die das Amplituden/Frequenz-Spektrum der Sprachlaute darstellen und jeweils den Signals chv/ingunge η in einem bestimmten Frequenzbereich des Spektrums entsprechen, dadurch gekennzeichnet, daß mit dem Spektrumanalysator (14) eine Breite-Schrägen-Erkennungsschaltung (16), in der positive und negative Schrägen in vorgegebenen Bereichen der Hüllkurve des Eingangssprachlaut-Frequenzspektrums erkannt und entsprechende Schrägensignale (auf Leitungen 28 bis 53) erzeugt werden, und eine Energieverhältnis-Erkennungsschaltung (27) zum Erzeugen von Energieverhältnissignalen (auf Leitungen 54 1 bis 54 n), die jeweils dem Verhältnis der Summe der Amplituden ausgewählter Spektralschwingungssignale (ü ) zur Summe der Amplituden ausgewählter anderer Spektralschwingungssignale entsprechen, gekoppelt sind, daß mit der Schrägenschaltung (26) eine Schrägenverhältnis-Erkennungsschaltung (55) zum Erzeugen von Schrägenverhältnissignalen (auf Leitungen 56 1 bis 56 n), die jeweils dem Verhältnis einer Summe der Amplituden von ausgewählten Schrägensignalen zur Summe der Amplituden ausgewählter anderer Schrägensignale entsprechen, gekoppelt sind und daß mit der Schrägenschaltung (26), der Energieverhältnisschaltung (27) und der Schrägenverhältnisschaltung (55) ein Lauterkenner (57) verbunden ist, der Ausgangssignale liefert, die erkannten Eingangssprachlauten entsprechen,2, Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß die Energieverhältnis<schaltung (27) ein Energieverhältnissign;al. an einer entsprechenden Ausgangsklemme (54 1 bis 54 n) liefert, wenn die Summe der Ampli- *■ tuden einer entsprechenden ersten Anzahl ausgewählte3? spektral-schwinßunßösignäle (E) die Summe der Amplituden einer entsprechenden zweiten Anzahl ausgewählter Spektralschwincungssignale um einen vorgegebenen. Schwellwertbetrag überscnreitet, und daß die ochrücenverhältnisschaltung (55) ein Schrägenverhältnissignal an einer entsprechenden Auscangsklemme ('56 1 bis 56 n) liefert, wenn die Summe der Amplituden einer entsprechenden ersten Anzahl ausgewählter Schrägensignale die Summe der Amplituden einer entsprechenden zweiten Anzahl ausgewählter Schrägensignale um einen zugehörigen vorgegebenen Schwellwertbetrag überschreitet. · ..·■'..3. Einrichtung nach Anspruch 1 oder 2, d a d u r c h g e k e η η zeichnet, daß der Spektrumanalysator eine Schaltung (16, 17, 18 o) zum Erzeugen eines Gesamtenergieschwincungssignales enthält, welches den Energieinhalt der Spektralschw.ingunrssignale im ganzen Bereich der vorgegebenen Frequenzen des Amplituden/Frequenzspektrums darstellt.k. einrichtung nach Anspruch 1, 2 oder 3» dadurch ο e k e η η ζ e i c h η e t, daß der Lauterkenner (5T) eine Lautfolgeerkennungsschaltung zur Kombination bestimmter Lauterkennunijssignale und zum Erkennen des Vorliegens bestimmter Wörter in den Eingangssprachlauten enthält.5. einrichtung, nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß mit dem Spektrumanalysator (IH) eine Multiplexanordnung (19) gekoppelt ist, die ein zeitlich verschachteltes Multiplexsignal- aus mindestens M Zeitkanalintervallen liefert, wobei jedes Spektralschwingungssignal ein entsprechendes Zeitkanalintervall einnimmt; daß mit der Ausgangsklemme der Multiplexanordnung (19) ein nicntlinearer Verstärker (21) gekoppelt ist, der ein Signal entsprechend dem Logarithmus des Multiplexsignales liefert; daß mit dem nichtlinearen Verstärker (21) mindestens η Abgreif- und Halteschaltuncen (2k a bis 2k o) einschließlich einer Schaltvor-0 098 87 /1304richtung (23 a bis 23 ο) gekoppelt sind, welch letztere die Ab greif- und Halteschaltungen (24 a bis 24 o) zu Zeiten, die dom Auftreten der Zeitkanalintervalle entsprechen, der Reihe nach betätigt, so daß an den Ausgangsklemmen (25a bis 25 o) mindestens η logarithmische Amplitudenniveaus zur Verfügung stenen; daß die ochrügenscnaltung (26), die zwei Sätze von Jiingangsklernmen und entsprechende Ausgangsklemmen aufweist, mit den Abgrcif- und ual-teschaltungen (24 a bis 24 o) bekoppelt ist, um eine Anzahl von Cchrügensignalen an den Ausgangsklemmen zu erzeugen, die jeweils der .Summe der logarithmiscnen Amplitudenwerte an den Kingangn-Klemmen der ersten Gruppe abzüglich der Summe der logarithmscnen ämplitudenwerte an den entsprechenden xiingangsklemmen der zweiten Gruppe entsprechen; daß die i^nergieverhältnisscnaltung (27), die zv.'ei Gruppen von Jingangskleumen und entsprechende Ausgangsklemmen aufweist, mit den Abgreif- und Halteschaltungen (24 a bin 24 o) gekoppelt ist und.an den Ausgangsklemmen Jnergieverhältnissignale liefert, wennjdie Summe der logarithmic cnen Amplituden-■werte an den entsprechenden iuingangsklemmen der ersten Gruppe abzüglich der Summe der logarithmischen Anplitudenwerte an den entsprechenden jiingangsklemmen der zweiten Gruppe einen vorgegebenen Schwellwert überschreitet; daß die Schrägenverhältnisschaltung - (55)3 die zwei Gruppe von Lingangsklemmen und entsprecnende Aus- « gangsklemmen aufweist, mit der Scnrägenscnaltung (26) gekoppelt ist und an entsprechenden Ausgangsklemmen ocnrägenverhaltnissignale liefert, wenn die Summe der Amplituden der Scnrägensignale an den entsprechenden tingangsklemmen der ersten Gruppe die Summe der Amplituden der Schrägensignale an den entsprechenden üin gangsr'.lemmen der zweiten Gruppe um einen vorgegebenen Schv/ellv:ertbetrag überscnreitet.6. Einrichtung nach Anspruch 3 und 5, dadurch gekennzeichnet, daß das Gesar.tenergiesignal (auf aer Leitung 18 o) eier !iultiplexanorinun'-; (15) zugeführt ist und im Ausgangssignal dor !'ultiplexanorinu-',.^ ein entsprecnendes Zeit- ::ar.alintervall e:\mi:r.r.t.009887/13047. Einrichtung nach Anspruch 5 oder 6, d a d u r c h ge lc en η ζ e i c h η e t/ daß die Schrägenschaltung (26) eine Anordnung (60, 62 bis .66) zum Erzeugen von Breite-Positive Schrägen.-signalen (BPS) enthält, die proportional der Amplitude von Spektraischwingungssignalen (n+2) + (n+1) minus Xn-I) + (n), sowie eine Anordnung (61, 6j bis 71) zum Erzeugen von BreiteiJegative-Schrägensignalen (BNS), die proportionall den Amplituden von Spektralschwingungssignalen (n-1) + (ή) minus (n+1) + (n+2) sind, enthält.8, Einrichtung nach Anspruch 6, d a du r c h gekennzeichnet, daß der Lauterkenner (57) einen Lautfolgeerkenner enthält, der durch Kombination ausgewählter Lauterkennungssignale das Vorliegen bestimmter Wörter in den Eingangssprachlauten erkennt und Wortanfänge, Wortenden und Pausen in diesen durch Verarbeiten des Gesamtenergiesignals ermittelt.BAD ORIGINAL0 0 9887/130
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US84603569A | 1969-07-30 | 1969-07-30 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE2020753A1 true DE2020753A1 (de) | 1971-02-11 |
Family
ID=25296762
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE19702020753 Pending DE2020753A1 (de) | 1969-07-30 | 1970-04-28 | Einrichtung zum Erkennen vorgegebener Sprachlaute |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US3588363A (de) |
| JP (1) | JPS4919922B1 (de) |
| DE (1) | DE2020753A1 (de) |
| GB (1) | GB1310265A (de) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE2649259A1 (de) * | 1976-10-29 | 1978-05-03 | Tekade Felten & Guilleaume | Verfahren zur automatischen verarbeitung von gestoerter telefonsprache |
| FR2435042A1 (fr) * | 1978-08-31 | 1980-03-28 | Landis & Gyr Ag | Detecteur permettant de determiner l |
| DE3226929A1 (de) * | 1981-07-24 | 1983-02-10 | Asulab S.A., 2502 Bienne | Sprachgesteuertes geraet |
| DE3200645A1 (de) * | 1982-01-12 | 1983-07-21 | Matsushita Electric Works, Ltd., Kadoma, Osaka | "verfahren und vorrichtung zur spracherkennung" |
| DE3522364A1 (de) * | 1984-06-22 | 1986-01-09 | Ricoh Co., Ltd., Tokio/Tokyo | System zum erkennen von sprache |
| DE3639756A1 (de) * | 1985-11-21 | 1987-06-11 | Ricoh Kk | Stimmspektrumsanalyseeinrichtung und -verfahren |
Families Citing this family (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3755627A (en) * | 1971-12-22 | 1973-08-28 | Us Navy | Programmable feature extractor and speech recognizer |
| GB1435779A (en) * | 1972-09-21 | 1976-05-12 | Threshold Tech | Word recognition |
| US3855417A (en) * | 1972-12-01 | 1974-12-17 | F Fuller | Method and apparatus for phonation analysis lending to valid truth/lie decisions by spectral energy region comparison |
| US4032710A (en) * | 1975-03-10 | 1977-06-28 | Threshold Technology, Inc. | Word boundary detector for speech recognition equipment |
| US4038503A (en) * | 1975-12-29 | 1977-07-26 | Dialog Systems, Inc. | Speech recognition apparatus |
| US4063031A (en) * | 1976-04-19 | 1977-12-13 | Threshold Technology, Inc. | System for channel switching based on speech word versus noise detection |
| US4343969A (en) * | 1978-10-02 | 1982-08-10 | Trans-Data Associates | Apparatus and method for articulatory speech recognition |
| DE3008830A1 (de) * | 1980-03-07 | 1981-10-01 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zum betrieb eines spracherkennungsgeraetes |
| US4737976A (en) * | 1985-09-03 | 1988-04-12 | Motorola, Inc. | Hands-free control system for a radiotelephone |
| US4941178A (en) * | 1986-04-01 | 1990-07-10 | Gte Laboratories Incorporated | Speech recognition using preclassification and spectral normalization |
| US4891602A (en) * | 1987-01-07 | 1990-01-02 | Bernard Strehler | Visual/voice input recognition sensor |
| US5832440A (en) * | 1996-06-10 | 1998-11-03 | Dace Technology | Trolling motor with remote-control system having both voice--command and manual modes |
| EP1286329B1 (de) * | 2001-08-23 | 2006-03-29 | Culturecom Technology (Macau) Ltd. | Verfahren und Vorrichtung zur phonetischen Spracherkennung |
| US8346559B2 (en) * | 2007-12-20 | 2013-01-01 | Dean Enterprises, Llc | Detection of conditions from sound |
| WO2023090218A1 (ja) | 2021-11-16 | 2023-05-25 | 株式会社Ihi原動機 | レシプロエンジンシステム、レシプロエンジンの運転方法 |
-
1969
- 1969-07-30 US US846035A patent/US3588363A/en not_active Expired - Lifetime
-
1970
- 1970-04-22 GB GB1935470A patent/GB1310265A/en not_active Expired
- 1970-04-28 DE DE19702020753 patent/DE2020753A1/de active Pending
- 1970-04-30 JP JP45037120A patent/JPS4919922B1/ja active Pending
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE2649259A1 (de) * | 1976-10-29 | 1978-05-03 | Tekade Felten & Guilleaume | Verfahren zur automatischen verarbeitung von gestoerter telefonsprache |
| FR2435042A1 (fr) * | 1978-08-31 | 1980-03-28 | Landis & Gyr Ag | Detecteur permettant de determiner l |
| DE3226929A1 (de) * | 1981-07-24 | 1983-02-10 | Asulab S.A., 2502 Bienne | Sprachgesteuertes geraet |
| DE3200645A1 (de) * | 1982-01-12 | 1983-07-21 | Matsushita Electric Works, Ltd., Kadoma, Osaka | "verfahren und vorrichtung zur spracherkennung" |
| DE3522364A1 (de) * | 1984-06-22 | 1986-01-09 | Ricoh Co., Ltd., Tokio/Tokyo | System zum erkennen von sprache |
| DE3639756A1 (de) * | 1985-11-21 | 1987-06-11 | Ricoh Kk | Stimmspektrumsanalyseeinrichtung und -verfahren |
Also Published As
| Publication number | Publication date |
|---|---|
| US3588363A (en) | 1971-06-28 |
| GB1310265A (en) | 1973-03-14 |
| JPS4919922B1 (de) | 1974-05-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE2020753A1 (de) | Einrichtung zum Erkennen vorgegebener Sprachlaute | |
| DE2918533C2 (de) | ||
| DE2613258C2 (de) | Schaltungsanordnung zum Erkennen von einem oder mehreren Schlüsselworten in kontinuierlicher Sprache | |
| DE69121312T2 (de) | Geräuschsignalvorhersagevorrichtung | |
| DE2659096C2 (de) | ||
| DE10030105A1 (de) | Spracherkennungseinrichtung | |
| DE3645118C2 (de) | ||
| DE2326517A1 (de) | Verfahren und schaltungsanordnung zum erkennen von gesprochenen woertern | |
| DE2825110A1 (de) | Verfahren zur erkennung kontinuierlicher sprachsignale | |
| DE2422028C2 (de) | Schaltungsanordnung zur Identifizierung einer Formantfrequenz in einem gesprochenen Wort | |
| DE4031638C2 (de) | ||
| DE2825082A1 (de) | Verfahren zur spracherkennung | |
| DE2753707A1 (de) | Einrichtung zur erkennung des auftretens eines kommandowortes aus einer eingangssprache | |
| DE69720134T2 (de) | Spracherkenner unter Verwendung von Grundfrequenzintensitätsdaten | |
| DE2636032C3 (de) | Elektrische Schaltungsanordnung zum Extrahieren der Grundschwingungsperiode aus einem Sprachsignal | |
| EP0508547B1 (de) | Schaltungsanordnung zur Spracherkennung | |
| DE69020736T2 (de) | Wellenanalyse. | |
| DE2720666C2 (de) | Verfahren und Anordnung zur Geräuschanalyse | |
| DE2021126A1 (de) | Spracherkennungsvorrichtung | |
| DE1206167B (de) | Schaltung zur Verbesserung der Erkennbarkeit von Lauten bei der Schallanalyse | |
| DE69025932T2 (de) | Einrichtung und verfahren zum erzeugen von stabilisierten darstellungen von wellen | |
| DE2109436A1 (de) | Amphtudenregler für elektrische Signale | |
| DE2431458A1 (de) | Verfahren zur automatischen sprechererkennung | |
| DE1422056A1 (de) | Phonetische Schreibmaschine | |
| DE1547027C3 (de) | Verfahren und Anordnung zur Konsonantenbestimmung in Sprachsignalen |