DE2334459A1 - Unterscheidung zwischen stimmhaften und stimmlosen lauten bei der sprachsignalauswertung - Google Patents
Unterscheidung zwischen stimmhaften und stimmlosen lauten bei der sprachsignalauswertungInfo
- Publication number
- DE2334459A1 DE2334459A1 DE19732334459 DE2334459A DE2334459A1 DE 2334459 A1 DE2334459 A1 DE 2334459A1 DE 19732334459 DE19732334459 DE 19732334459 DE 2334459 A DE2334459 A DE 2334459A DE 2334459 A1 DE2334459 A1 DE 2334459A1
- Authority
- DE
- Germany
- Prior art keywords
- input
- output
- counter
- sampling switch
- unvoiced
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measurement Of Current Or Voltage (AREA)
Description
SIEMENS AKTIENGESELLSCHAFT München, den
Berlin und München Witteisbacherplatz 2
VPA 73/GG14
Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung.
Zusatz zu VPA 70/6823 (Akt.Z.: P 20 62 589.2)
Das Hauptpatent betrifft neben einem Verfahren zur Ermittlung der Grundfrequenz eines wenigstens zeitweise periodischen
Signales, insbesondere eines Spracl-signales, ein Verfahren
zur Unterscheidung eines stimmhaften von einem stimmlosen
Laut sowie Schaltungsanordnungen zur Durchführung dieser
Verfahren. Die Schaltungsanordnung nach dem Hauptpatent besteht aus einer Laufzeitkette mit mehreren Stufen, aus Differenzverstärkern,
Gleichrichteranordnungen, Summiergliedern, einem Abtastschalter, einer Vergleichsspannungsquelle ^ einem Taktgenerator
und einem Zähler, der bestimmte Takte des Taktgenerators zählt.
Das Verfahren zur Ermittlung' der Grundfrequenz eines wenigstens
zeitweise periodischen Signales nach dem Hauptpatent beruht auf dem Prinzip, den zeitlichen Abstand der einzelnen periodischen
"Schwingungspakete" zu messen. Zu diesem Zweck werden dem Signal zu vorzugsweise äquidistanten, aufeinanderfolgenden
Zeitpunkten Proben entnommen und für eine vorbestimmte
Zeitdauer, beispielsweise in den einzelnen Stufen einer Laufzeitkette, gespeichert. Nach der Speicherung werden die Proben
mit dem Eingangssignal unter Differenzbildung verglichen. Während es für die Ermittlung der Grundfrequenz des Signales
auf die kürzeste Zeitspanne zwischen_ der Entnahme der ersten
Probe und dem Auftreten eines Minimalwerts bei der Differenzbildung ankommt, wird für die Unterscheidung eines stimmhaften
von einem stimmlosen Laut das Auftreten von eine vorgegebene Schwellenwertspannung unterschreitende Minima des Vergleichsergebnisses
ausgenutzt.
VPA 9/644/1002 d Ah/Ky - 2 -
409884/0789
Die Erfindung "bezieht sich also auf ein Verfahren zur Auswertung
eines Sprachsignales, bei dem als Kriterium für die Unterscheidung eines stimmhaften von einem stimmlosen Laut
das Auftreten von, eine vorgegebene Schwellwertspannung unterschreitende Minima des in Form von Differenzspannungen
auftretenden Vergleichsergebnisses aus dem Eingangssignal
und den einzelnen Abtastproben dient, nach Patent
(Akt.Z,: P 20 62 589-2).
Die Pig. 1 zeigt den typischen Spannungsverlauf eines stimmhaften Lautes, wobei erkennbar ist, daß sich einzelne Schwingungspakete
mit der Periode der Grundfrequenz t.. wiederholen. Pur stimmlose Laute ist ein derartiger typischer Spannungsverlauf
nicht angebbar, da stimmlose Laute im wesentlichen durch das Auftreten eines Rauschens mit mehr oder weniger großer
'Amplitude gekennzeichnet sind. Yfeiterhin ist zu beachten, daß bei stimmlosen Sprachsignalen die Hauptenergie bei Frequenzen
von über 3 kHz liegt, während für die· Erkennung der Grundfrequenz
stimmhafter Laute ein Sprachband von etwa 300 Hz bis 1 kHz ausreicht. Um Unsicherheiten bei der Grundfrequenzerkennung
zu "vermeiden, wird das Sprachsignal deshalb gewöhnlich
über einen Bandpaß mit dem Durchlaßbereich von 300 Hz bis 1 kHz geleitet. Dadurch werden aber stimmlose Sprachanteile
fast völlig ausgefiltert, so daß sich Unsicherheiten bei der
Stimmhaft- Stimmlos-Unterscheidung ergeben.
Der Erfindung liegt nun die Aufgabe zugrunde, ein Verfahren der eingangs erwähnten Art zu entwickeln, bei dem eine sichere
Stimmhaft- Stimmlos-Unterscheidung möglich ist.
Diese Aufgabe wird gemäß der Erfindung dadurch gelöst, daß eine die Zahl 20 überschreitende Vielzahl von Differenzspannungen
mit der Schwellwertdpannung verglichen wird, daß diejenigen
Diiferenzspannungen, die kleiner als die Schwellwerb-
VPA 9/644/1002 d _ 3 _
Λ0988Α/078Α
Spannung sind, gezählt werden und daß ab einer, entsprechend
der geforderten Genauigkeit festgelegten Anzahl auf ein stimmloses Sprechsignal erkannt wird.
Der Hauptvorteil des erfindungsgemäßen Verfahren liegt also darin, daß eine sichere Unterscheidung zwischen einem stimmhaften
und einem stimmlosen Sprachanteil getroffen wird und
sich so bei der Wiedergabe eine klarere Sprache ergibt. Ein weiterer Vorteil liegt darin, daß diese Unterscheidung mit
einem relativ geringem Aufwand durchgeführt wird. Bei einer vorteilhaften Variante des Verfahrens nach der Erfindung, das
eine Unterscheidung mit großer Sicherheit durchführt, wird ab einer Anzahl von 16 Differenzspannungen, die kleiner als die
Schwellwertspannungen sind, auf ein stimmloses Sprachsignal erkannt. -
Anhand des in der Pig. 2 der Zeichnung dargestellten Ausführungsbeispiels soll die Erfindung im folgenden noch näher erläutert
werden. Die Pig. 2 zeigt das Blockschaltbild einer Anordnung
zur Sprachsignalauswertung mit einer Unterscheidungsmöglichkeit zwischen stimmhaften und stimmlosen Lauten. Im einzelnen ist
ein Signaleingang 8 für 'das auszuwertende Signal vorgesehen, der mit dem Eingang eines Regelverstärkers V1 verbunden ist. Der
Regelverstärker sorgt für eine konstante mittlere Aussteuerung der nachfolgenden Schaltung und kann deshalb entfallen, falls
diese konstante Aussteuerung ohnehin gegeben ist.
Mit dem Ausgang 81 des Regelverstärkers V1 oder mit dem Signaleingang
8 ist der Eingang der ersten Stufe τ1 einer Laufzeitkette verbunden. Die weiteren Stufen 'der Laufzeitkette
(τ2...τη) sind hintereinander geschaltet und mit dem Ausgang der ersten Stufe verbunden. Mit dem Ausgang jeder Stufe der
Laufzeitkette ist ein erster Eingang jeweils eines Differenzverstärkers Al ... An verbunden, der andere Eingang jedes der
VPA 9/644/1002 d - 4 -
409884/0789
Differenzverstärker ist mit dem Ausgang 8' des Regelverstärkers V1 oder mit dem Signaleingang 8 direkt verbunden
und erhält so ein unverzögertes Signal.
In jedem der Differenzverstärker A1 ... An wird die Differenz zwischen dem unverzögerten Signal und demjenigen
Signal gebildet, das nach einer bestimmten, sich von Stufe zu Stufe steigernden Verzögerung am Ausgang
der jeweiligen Stufe abgegeben wird. Der Ausgang jedes der Differenzverstärker ist mit einer der Gleichrichteranordnungen
G1...Gn verbunden, die vorzugsweise aus Doppelweggleichrichtern bestehen. An den Ausgang jeder der Gleichrichteranordnungen
sind Summierglieder angeschlossen, die zumindest aus jeweils einem Kondensator C1...Cn bestehen.
In Parallelschaltung mit den Kondensatoren können Entladewiderstände vorgesehen werden, diese Widerstände können
aber auch an anderer Stelle in der Schaltung auftreten. Die Widerstände können auch entfallen, wenn - wie im vorliegenden
Fall - in anderer Weise für eine Entladung der Kondensatoren G1...Cn gesorgt wird.
Jedes der Summierglieder und damit jeder,der Kondensatoren
C1...Cn ist mit einem der festen Anschlüsse, also mit einem der Eingänge des Abtastschalters 5 verbunden. 'Durch die gestrichelt
dargestellte Leitung L1 soll angedeutet werden, daß der Abtastschalter 5 von einem über den Eingang 61 mit
einem Taktgenerator 4 verbundenen ersten Zähler 6 gesteuert wird. Da der Ausgang des Abtastschalters 5 mit dem einen Eingang
71 eines Vergleichers 7 verbunden ist, gelangen die durch den Abtastschalter 5 von den Summiergliedern abgetasteten
Spannungen zum Vergleicher 7· Der andere Eingang-72 des Vergleichers
7 ist mit einer Vergleichsspannungsquelle Ur1 und mit einem Anschluß eines Siebkondensators C verbunden.
VPA 9/644/1002 d - 5 -
£09884/0789
233U59
_ 5 —
Ist die von dem Abtastschalter 5 ausgewählte, zu vergleichende Spannung gleich oder kleiner der von der
Vergleichsspannungsquelle Ur1 abgegebenen Vergleichsspannung, tritt also ein Vergleichsminimum auf, dann
gibt der Vergleicher 7 einen Impuls ab, der dem Eingang 62 des ersten Zählers 6 und dem Eingang 81 des
zweiten Zählers STZ zugeführt wird. Nach Erhalt des ersten Impulses vom Ausgang des Vergleichers 7 gibt der
erste Zähler 6 vom Ausgang 64 über die Steuerleitung L1 einen Impuls zum Abtastschalter 5, durch den dieser veranlaßt
wird, die Verbindung mit einem weiteren Anschluß herzustellen. Außerdem kann der erste Zähler 6 die im Haupt patent
beschriebene Ermittlung der Grundfrequenz durchführen. Das Ergebnis des ersten Zählers 6 wird über dessen
Ausgang 65 zum Eingang 82 des zweiten Zählers STZ übertragen. Hat der zweite Zähler STZ den Zählerstand von beispielsweise
16 erreicht, dann gibt er an seinem Ausgang 84 ein Signal ab, das das Auftreten eines stimmlosen Lautes meldet. Y/eiterhin
wird über den Ausgang 83 ein. Rückstellimpuls zum Eingang des Zählers 6 gegeben, durch den dieser auf ITuIl zurückgestellt
wird.
Diese Anordnung zur Unterscheidung zwischen stimmhaften und
stimmlosen Lauten in einem Sprachsignal kann mit Anordnungen zur Ermittlung der Grundfrequenz kombiniert werden, so daß
eine umfassende Anordnung zur Sprachauswertung entsteht.
3 Patentansprüche
2 Figuren
2 Figuren
VPA 9/644/1002 d - 6 -
409884/0789
Claims (3)
1. Verfahren zur Ausv/ertung eines Sprachsignales, bei
v y dem als Kriterium für die Unterscheidung eines stimmhaften
von einem stimmlosen Laut das Auftreten von, eine vorgegebene Schwellwertspannung unterschreitende
Minima des in Form von Differenzspannungen auftretenden
Vergleiehsergebnisses aus dem Eingangssignal und den einzelnen Abtastproben dient, nach Patentanspruch 2
. von Patent (Akt.Z.: 20 62-589.2), dadurch
gekennzeichnet,
daß eine die Zahl 20 überschreitende Vielzahl von Differenzspannungen
mit der Schwellwertspannung verglichen wird,
daß diejenigen Differenzspannungen, die kleiner als die
Schwellwertspannung sind, gezählt werden und
daß ab einer entsprechend der geforderten Genauigkeit festgelegten Anzahl auf ein stimmloses Sprachsignal erkannt
wird.
2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet,
daß ab einer Anzahl von 16 Differenzspannungen, die kleiner als die Sehwellwertspannung sind, auf ein stimmloses
Sprachsignal erkannt wird,
3. Anordnung zur Durchführung des Verfahrens nach Anspruch oder 2, dadurch gekennzeichnet,
daß eine laufzeitkette mit η Stufen (τ1...τη) vorgesehen
ist,
daß Differenzverstärker (A1...An) vorgesehen sind, die
mit ihrem jeweils ersten Eingang an die Ausgänge der
VPA 9/644/1002 d - 7 -
409884/0789
233U59
Stufen (τ1...τη) der Laufzeitkette angeschaltet sind und deren jeweils zweiter Eingang mit dem Eingang 8'
der Laufzeitkette verbunden ist, daß Summierglieder vorgesehen sind, die mit Masse verbunden
sind und zumindest jeweils einen Kondensator (C1...Cn) enthalten und über eine Gleichrichteranordnung
(G1...Gn) mit den Ausgängen der Differenzverstärker verbunden sind,
daß ein Abtastschalter (5) vorgesehen ist, dessen feste Anschlüsse (K1...Kn) mit den Kondensatoren (01...Cn) der
Summierglieder verbunden sind,
daß ein Vergleicner (7) vorgesehen ist, dessen einer
Eingang (71) mit dem Ausgang des Abtastschalters und dessen anderer Ausgeng (72) mit einer Vergleichsspannungsqulle
(Ur1) verbunden ist,
daß ein Taktgenerator (4) vorgesehen ist, dessen Takte den Abtastschalter steuern,
daß ein erster Zähler (6) vorgesehen ist, der die dem Abtastschalter (5) zugeführten Takte zählt und der über
eine Steuerleitung (L1) mit dem Abtastschalter (5) verbunden ist, der außerdem mit dem Ausgang des Vergleichers
(7) iind mit dem Ausgang des Taktgenerators verbunden
ist und
daß ein zweiter Zähler (STZ) mit einem ersten und einem zweiten Eingang (81,82) und einem ersten und einem zweiten
Ausgang (85,84) vorgesehen ist, dessen erster Eingang (81) mit dem Ausgang des Vergleichers (7), dessen zweiter Eingang
(82) mit einem Ausgang des ersten Zählers (6) und dessen erster Ausgang (83) mit einem Eingang des ersten
Zählers (6) verbunden ist und
daß an dem zweiten Ausgang (84) des zweiten Zählers (STZ) bei Auftreten eines stimmlosen Signales ein Steuerimpuls
entnehmbar ist.
VPA 9/644/1002 d
409884/0789
Leerseite
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE19732334459 DE2334459C3 (de) | 1973-07-06 | 1973-07-06 | Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE19732334459 DE2334459C3 (de) | 1973-07-06 | 1973-07-06 | Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| DE2334459A1 true DE2334459A1 (de) | 1975-01-23 |
| DE2334459B2 DE2334459B2 (de) | 1981-07-02 |
| DE2334459C3 DE2334459C3 (de) | 1982-03-25 |
Family
ID=5886153
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE19732334459 Expired DE2334459C3 (de) | 1973-07-06 | 1973-07-06 | Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung |
Country Status (1)
| Country | Link |
|---|---|
| DE (1) | DE2334459C3 (de) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2316814A1 (fr) * | 1975-07-03 | 1977-01-28 | Telettra Lab Telefon | Procede et dispositif de detection de la presence et/ou l'absence d'un signal de parole dans des lignes telephoniques |
| EP0054365A1 (de) * | 1980-12-09 | 1982-06-23 | Secretary of State for Industry in Her Britannic Majesty's Gov. of the United Kingdom of Great Britain and Northern Ireland | Spracherkennungssystem |
| GB2357683A (en) * | 1999-12-24 | 2001-06-27 | Nokia Mobile Phones Ltd | Voiced/unvoiced determination for speech coding |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE1186230B (de) * | 1961-11-14 | 1965-01-28 | Ibm | Verfahren und Anordnung zum automatischen Erkennen gesprochener Woerter |
| DE1572453A1 (de) * | 1967-12-16 | 1970-07-16 | Ibm | Schaltungsanordnung zur Analyse und Synthese von Sprachsignalen |
| DE1926362B2 (de) * | 1968-05-27 | 1971-07-22 | Einrichtung zur sprachanalyse und synthese nach dem vocoderprinzip | |
| DE2062589A1 (de) * | 1970-12-18 | 1972-06-29 | Siemens Ag | Verfahren zur Ermittlung der Grundfrequenz eines wenigstens zeitweise periodischen signals |
-
1973
- 1973-07-06 DE DE19732334459 patent/DE2334459C3/de not_active Expired
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE1186230B (de) * | 1961-11-14 | 1965-01-28 | Ibm | Verfahren und Anordnung zum automatischen Erkennen gesprochener Woerter |
| DE1572453A1 (de) * | 1967-12-16 | 1970-07-16 | Ibm | Schaltungsanordnung zur Analyse und Synthese von Sprachsignalen |
| DE1926362B2 (de) * | 1968-05-27 | 1971-07-22 | Einrichtung zur sprachanalyse und synthese nach dem vocoderprinzip | |
| DE2062589A1 (de) * | 1970-12-18 | 1972-06-29 | Siemens Ag | Verfahren zur Ermittlung der Grundfrequenz eines wenigstens zeitweise periodischen signals |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2316814A1 (fr) * | 1975-07-03 | 1977-01-28 | Telettra Lab Telefon | Procede et dispositif de detection de la presence et/ou l'absence d'un signal de parole dans des lignes telephoniques |
| EP0054365A1 (de) * | 1980-12-09 | 1982-06-23 | Secretary of State for Industry in Her Britannic Majesty's Gov. of the United Kingdom of Great Britain and Northern Ireland | Spracherkennungssystem |
| GB2357683A (en) * | 1999-12-24 | 2001-06-27 | Nokia Mobile Phones Ltd | Voiced/unvoiced determination for speech coding |
| EP1111586A3 (de) * | 1999-12-24 | 2002-10-16 | Nokia Corporation | Verfahren und Vorrichtung zur Sprachkodierung mit Stimmhaft-/Stimmlos-Entscheidung |
| US6915257B2 (en) | 1999-12-24 | 2005-07-05 | Nokia Mobile Phones Limited | Method and apparatus for speech coding with voiced/unvoiced determination |
Also Published As
| Publication number | Publication date |
|---|---|
| DE2334459B2 (de) | 1981-07-02 |
| DE2334459C3 (de) | 1982-03-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE2710877C2 (de) | Einbruch-Alarmsystem | |
| DE2816333A1 (de) | Verfahren und anordnung zum lesen eines strichcodes | |
| DE69026185T2 (de) | Mehrfrequenzsignal-Empfänger und Verfahren zu dessen Erkennung | |
| DE2710834C2 (de) | Einbruch-Alarmsystem | |
| DE3102385C2 (de) | ||
| DE69325053T2 (de) | Verfahren zur Verbesserung der Empfindlichkeit und des Sprachschutzes eines Mehrfrequenzempfängers | |
| DE2515868B2 (de) | Vorrichtung zur messung des blutdrucks | |
| DE1572516A1 (de) | Schaltungsanordnung fuer die Spracherkennung | |
| DE19961817B4 (de) | Frequenzabweichung detektierendes Gerät und Frequenzabweichungs-Detektionsverfahren | |
| DE2334459A1 (de) | Unterscheidung zwischen stimmhaften und stimmlosen lauten bei der sprachsignalauswertung | |
| EP1382034B1 (de) | Verfahren zur bestimmung von intensitätskennwerten von hintergrundgeräuschen in sprachpausen von sprachsignalen | |
| DE2431458C2 (de) | Verfahren und Anordnung zur automatischen Sprechererkennung | |
| DE2750153B2 (de) | Verfahren und Vorrichtung zur Auswertung von Garnsignalen zum Erkennen zumindest angenähert periodischer Querschnittsschwankungen an Offenendspinnmaschinen o.dgl | |
| EP0100891A1 (de) | Verfahren und Vorrichtung zur Korrektur von Koinzidenzfehlern beim Zählen von Teilchen zweier Sorten | |
| DE2062589A1 (de) | Verfahren zur Ermittlung der Grundfrequenz eines wenigstens zeitweise periodischen signals | |
| DE19806787A1 (de) | Vorrichtung zur Erkennung oder zur Analyse von Maschinenschäden | |
| DE2712831C3 (de) | ||
| DE1122274B (de) | Verfahren und Anordnung zur automatischen Erkennung von Sprache | |
| DE2719248C2 (de) | Frequenzselektiver Zeichenempfänger für Fernmelde-, insbesondere Fernsprechanlagen | |
| DE1940082A1 (de) | Verfahren zum Erkennen von Sprachmerkmalen und deren Aufzeichung mittels einer elektrisch gesteuerten Schreibmaschine | |
| DE2345980C2 (de) | Mehrfachausnutzung einer Laufzeitkette für eine Schaltungsanordnung zur Sprachauswertung | |
| DE3411485A1 (de) | Verfahren zur erfassung der grenzen von signalen, die vor einem hintergrundsignalgemisch auftreten | |
| DE2313009C2 (de) | Anordnung zur Durchführung eines Verfahrens zur Grundfrequenzermittlung mit Ausblendung der Subharmonischen der Grundfrequenz | |
| DE2309785A1 (de) | Grundfrequenzermittlung mit gleitendem entscheiderschwellwert | |
| DE2759259A1 (de) | Verfahren zur erkennung der frequenz eines binaer frequenzmodulierten signals |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| AF | Is addition to no. |
Ref country code: DE Ref document number: 2062589 Format of ref document f/p: P |
|
| C3 | Grant after two publication steps (3rd publication) | ||
| 8340 | Patent of addition ceased/non-payment of fee of main patent |