[go: up one dir, main page]

DE2334459A1 - Unterscheidung zwischen stimmhaften und stimmlosen lauten bei der sprachsignalauswertung - Google Patents

Unterscheidung zwischen stimmhaften und stimmlosen lauten bei der sprachsignalauswertung

Info

Publication number
DE2334459A1
DE2334459A1 DE19732334459 DE2334459A DE2334459A1 DE 2334459 A1 DE2334459 A1 DE 2334459A1 DE 19732334459 DE19732334459 DE 19732334459 DE 2334459 A DE2334459 A DE 2334459A DE 2334459 A1 DE2334459 A1 DE 2334459A1
Authority
DE
Germany
Prior art keywords
input
output
counter
sampling switch
unvoiced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19732334459
Other languages
English (en)
Other versions
DE2334459B2 (de
DE2334459C3 (de
Inventor
Claus Balzereit
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Corp
Original Assignee
Siemens Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Corp filed Critical Siemens Corp
Priority to DE19732334459 priority Critical patent/DE2334459C3/de
Publication of DE2334459A1 publication Critical patent/DE2334459A1/de
Publication of DE2334459B2 publication Critical patent/DE2334459B2/de
Application granted granted Critical
Publication of DE2334459C3 publication Critical patent/DE2334459C3/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Current Or Voltage (AREA)

Description

SIEMENS AKTIENGESELLSCHAFT München, den
Berlin und München Witteisbacherplatz 2
VPA 73/GG14
Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung.
Zusatz zu VPA 70/6823 (Akt.Z.: P 20 62 589.2)
Das Hauptpatent betrifft neben einem Verfahren zur Ermittlung der Grundfrequenz eines wenigstens zeitweise periodischen Signales, insbesondere eines Spracl-signales, ein Verfahren zur Unterscheidung eines stimmhaften von einem stimmlosen Laut sowie Schaltungsanordnungen zur Durchführung dieser Verfahren. Die Schaltungsanordnung nach dem Hauptpatent besteht aus einer Laufzeitkette mit mehreren Stufen, aus Differenzverstärkern, Gleichrichteranordnungen, Summiergliedern, einem Abtastschalter, einer Vergleichsspannungsquelle ^ einem Taktgenerator und einem Zähler, der bestimmte Takte des Taktgenerators zählt.
Das Verfahren zur Ermittlung' der Grundfrequenz eines wenigstens zeitweise periodischen Signales nach dem Hauptpatent beruht auf dem Prinzip, den zeitlichen Abstand der einzelnen periodischen "Schwingungspakete" zu messen. Zu diesem Zweck werden dem Signal zu vorzugsweise äquidistanten, aufeinanderfolgenden Zeitpunkten Proben entnommen und für eine vorbestimmte Zeitdauer, beispielsweise in den einzelnen Stufen einer Laufzeitkette, gespeichert. Nach der Speicherung werden die Proben mit dem Eingangssignal unter Differenzbildung verglichen. Während es für die Ermittlung der Grundfrequenz des Signales auf die kürzeste Zeitspanne zwischen_ der Entnahme der ersten Probe und dem Auftreten eines Minimalwerts bei der Differenzbildung ankommt, wird für die Unterscheidung eines stimmhaften von einem stimmlosen Laut das Auftreten von eine vorgegebene Schwellenwertspannung unterschreitende Minima des Vergleichsergebnisses ausgenutzt.
VPA 9/644/1002 d Ah/Ky - 2 -
409884/0789
Die Erfindung "bezieht sich also auf ein Verfahren zur Auswertung eines Sprachsignales, bei dem als Kriterium für die Unterscheidung eines stimmhaften von einem stimmlosen Laut das Auftreten von, eine vorgegebene Schwellwertspannung unterschreitende Minima des in Form von Differenzspannungen auftretenden Vergleichsergebnisses aus dem Eingangssignal
und den einzelnen Abtastproben dient, nach Patent
(Akt.Z,: P 20 62 589-2).
Die Pig. 1 zeigt den typischen Spannungsverlauf eines stimmhaften Lautes, wobei erkennbar ist, daß sich einzelne Schwingungspakete mit der Periode der Grundfrequenz t.. wiederholen. Pur stimmlose Laute ist ein derartiger typischer Spannungsverlauf nicht angebbar, da stimmlose Laute im wesentlichen durch das Auftreten eines Rauschens mit mehr oder weniger großer 'Amplitude gekennzeichnet sind. Yfeiterhin ist zu beachten, daß bei stimmlosen Sprachsignalen die Hauptenergie bei Frequenzen von über 3 kHz liegt, während für die· Erkennung der Grundfrequenz stimmhafter Laute ein Sprachband von etwa 300 Hz bis 1 kHz ausreicht. Um Unsicherheiten bei der Grundfrequenzerkennung zu "vermeiden, wird das Sprachsignal deshalb gewöhnlich über einen Bandpaß mit dem Durchlaßbereich von 300 Hz bis 1 kHz geleitet. Dadurch werden aber stimmlose Sprachanteile fast völlig ausgefiltert, so daß sich Unsicherheiten bei der Stimmhaft- Stimmlos-Unterscheidung ergeben.
Der Erfindung liegt nun die Aufgabe zugrunde, ein Verfahren der eingangs erwähnten Art zu entwickeln, bei dem eine sichere Stimmhaft- Stimmlos-Unterscheidung möglich ist.
Diese Aufgabe wird gemäß der Erfindung dadurch gelöst, daß eine die Zahl 20 überschreitende Vielzahl von Differenzspannungen mit der Schwellwertdpannung verglichen wird, daß diejenigen Diiferenzspannungen, die kleiner als die Schwellwerb-
VPA 9/644/1002 d _ 3 _
Λ0988Α/078Α
Spannung sind, gezählt werden und daß ab einer, entsprechend der geforderten Genauigkeit festgelegten Anzahl auf ein stimmloses Sprechsignal erkannt wird.
Der Hauptvorteil des erfindungsgemäßen Verfahren liegt also darin, daß eine sichere Unterscheidung zwischen einem stimmhaften und einem stimmlosen Sprachanteil getroffen wird und sich so bei der Wiedergabe eine klarere Sprache ergibt. Ein weiterer Vorteil liegt darin, daß diese Unterscheidung mit einem relativ geringem Aufwand durchgeführt wird. Bei einer vorteilhaften Variante des Verfahrens nach der Erfindung, das eine Unterscheidung mit großer Sicherheit durchführt, wird ab einer Anzahl von 16 Differenzspannungen, die kleiner als die Schwellwertspannungen sind, auf ein stimmloses Sprachsignal erkannt. -
Anhand des in der Pig. 2 der Zeichnung dargestellten Ausführungsbeispiels soll die Erfindung im folgenden noch näher erläutert werden. Die Pig. 2 zeigt das Blockschaltbild einer Anordnung zur Sprachsignalauswertung mit einer Unterscheidungsmöglichkeit zwischen stimmhaften und stimmlosen Lauten. Im einzelnen ist ein Signaleingang 8 für 'das auszuwertende Signal vorgesehen, der mit dem Eingang eines Regelverstärkers V1 verbunden ist. Der Regelverstärker sorgt für eine konstante mittlere Aussteuerung der nachfolgenden Schaltung und kann deshalb entfallen, falls diese konstante Aussteuerung ohnehin gegeben ist.
Mit dem Ausgang 81 des Regelverstärkers V1 oder mit dem Signaleingang 8 ist der Eingang der ersten Stufe τ1 einer Laufzeitkette verbunden. Die weiteren Stufen 'der Laufzeitkette (τ2...τη) sind hintereinander geschaltet und mit dem Ausgang der ersten Stufe verbunden. Mit dem Ausgang jeder Stufe der Laufzeitkette ist ein erster Eingang jeweils eines Differenzverstärkers Al ... An verbunden, der andere Eingang jedes der
VPA 9/644/1002 d - 4 -
409884/0789
Differenzverstärker ist mit dem Ausgang 8' des Regelverstärkers V1 oder mit dem Signaleingang 8 direkt verbunden und erhält so ein unverzögertes Signal.
In jedem der Differenzverstärker A1 ... An wird die Differenz zwischen dem unverzögerten Signal und demjenigen Signal gebildet, das nach einer bestimmten, sich von Stufe zu Stufe steigernden Verzögerung am Ausgang der jeweiligen Stufe abgegeben wird. Der Ausgang jedes der Differenzverstärker ist mit einer der Gleichrichteranordnungen G1...Gn verbunden, die vorzugsweise aus Doppelweggleichrichtern bestehen. An den Ausgang jeder der Gleichrichteranordnungen sind Summierglieder angeschlossen, die zumindest aus jeweils einem Kondensator C1...Cn bestehen. In Parallelschaltung mit den Kondensatoren können Entladewiderstände vorgesehen werden, diese Widerstände können aber auch an anderer Stelle in der Schaltung auftreten. Die Widerstände können auch entfallen, wenn - wie im vorliegenden Fall - in anderer Weise für eine Entladung der Kondensatoren G1...Cn gesorgt wird.
Jedes der Summierglieder und damit jeder,der Kondensatoren C1...Cn ist mit einem der festen Anschlüsse, also mit einem der Eingänge des Abtastschalters 5 verbunden. 'Durch die gestrichelt dargestellte Leitung L1 soll angedeutet werden, daß der Abtastschalter 5 von einem über den Eingang 61 mit einem Taktgenerator 4 verbundenen ersten Zähler 6 gesteuert wird. Da der Ausgang des Abtastschalters 5 mit dem einen Eingang 71 eines Vergleichers 7 verbunden ist, gelangen die durch den Abtastschalter 5 von den Summiergliedern abgetasteten Spannungen zum Vergleicher 7· Der andere Eingang-72 des Vergleichers 7 ist mit einer Vergleichsspannungsquelle Ur1 und mit einem Anschluß eines Siebkondensators C verbunden.
VPA 9/644/1002 d - 5 -
£09884/0789
233U59
_ 5 —
Ist die von dem Abtastschalter 5 ausgewählte, zu vergleichende Spannung gleich oder kleiner der von der Vergleichsspannungsquelle Ur1 abgegebenen Vergleichsspannung, tritt also ein Vergleichsminimum auf, dann gibt der Vergleicher 7 einen Impuls ab, der dem Eingang 62 des ersten Zählers 6 und dem Eingang 81 des zweiten Zählers STZ zugeführt wird. Nach Erhalt des ersten Impulses vom Ausgang des Vergleichers 7 gibt der erste Zähler 6 vom Ausgang 64 über die Steuerleitung L1 einen Impuls zum Abtastschalter 5, durch den dieser veranlaßt wird, die Verbindung mit einem weiteren Anschluß herzustellen. Außerdem kann der erste Zähler 6 die im Haupt patent beschriebene Ermittlung der Grundfrequenz durchführen. Das Ergebnis des ersten Zählers 6 wird über dessen Ausgang 65 zum Eingang 82 des zweiten Zählers STZ übertragen. Hat der zweite Zähler STZ den Zählerstand von beispielsweise 16 erreicht, dann gibt er an seinem Ausgang 84 ein Signal ab, das das Auftreten eines stimmlosen Lautes meldet. Y/eiterhin wird über den Ausgang 83 ein. Rückstellimpuls zum Eingang des Zählers 6 gegeben, durch den dieser auf ITuIl zurückgestellt wird.
Diese Anordnung zur Unterscheidung zwischen stimmhaften und stimmlosen Lauten in einem Sprachsignal kann mit Anordnungen zur Ermittlung der Grundfrequenz kombiniert werden, so daß eine umfassende Anordnung zur Sprachauswertung entsteht.
3 Patentansprüche
2 Figuren
VPA 9/644/1002 d - 6 -
409884/0789

Claims (3)

Patentansprüche
1. Verfahren zur Ausv/ertung eines Sprachsignales, bei v y dem als Kriterium für die Unterscheidung eines stimmhaften von einem stimmlosen Laut das Auftreten von, eine vorgegebene Schwellwertspannung unterschreitende Minima des in Form von Differenzspannungen auftretenden Vergleiehsergebnisses aus dem Eingangssignal und den einzelnen Abtastproben dient, nach Patentanspruch 2
. von Patent (Akt.Z.: 20 62-589.2), dadurch
gekennzeichnet,
daß eine die Zahl 20 überschreitende Vielzahl von Differenzspannungen mit der Schwellwertspannung verglichen wird, daß diejenigen Differenzspannungen, die kleiner als die Schwellwertspannung sind, gezählt werden und daß ab einer entsprechend der geforderten Genauigkeit festgelegten Anzahl auf ein stimmloses Sprachsignal erkannt wird.
2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet,
daß ab einer Anzahl von 16 Differenzspannungen, die kleiner als die Sehwellwertspannung sind, auf ein stimmloses Sprachsignal erkannt wird,
3. Anordnung zur Durchführung des Verfahrens nach Anspruch oder 2, dadurch gekennzeichnet, daß eine laufzeitkette mit η Stufen (τ1...τη) vorgesehen ist,
daß Differenzverstärker (A1...An) vorgesehen sind, die mit ihrem jeweils ersten Eingang an die Ausgänge der
VPA 9/644/1002 d - 7 -
409884/0789
233U59
Stufen (τ1...τη) der Laufzeitkette angeschaltet sind und deren jeweils zweiter Eingang mit dem Eingang 8' der Laufzeitkette verbunden ist, daß Summierglieder vorgesehen sind, die mit Masse verbunden sind und zumindest jeweils einen Kondensator (C1...Cn) enthalten und über eine Gleichrichteranordnung (G1...Gn) mit den Ausgängen der Differenzverstärker verbunden sind,
daß ein Abtastschalter (5) vorgesehen ist, dessen feste Anschlüsse (K1...Kn) mit den Kondensatoren (01...Cn) der Summierglieder verbunden sind,
daß ein Vergleicner (7) vorgesehen ist, dessen einer Eingang (71) mit dem Ausgang des Abtastschalters und dessen anderer Ausgeng (72) mit einer Vergleichsspannungsqulle (Ur1) verbunden ist,
daß ein Taktgenerator (4) vorgesehen ist, dessen Takte den Abtastschalter steuern,
daß ein erster Zähler (6) vorgesehen ist, der die dem Abtastschalter (5) zugeführten Takte zählt und der über eine Steuerleitung (L1) mit dem Abtastschalter (5) verbunden ist, der außerdem mit dem Ausgang des Vergleichers (7) iind mit dem Ausgang des Taktgenerators verbunden ist und
daß ein zweiter Zähler (STZ) mit einem ersten und einem zweiten Eingang (81,82) und einem ersten und einem zweiten Ausgang (85,84) vorgesehen ist, dessen erster Eingang (81) mit dem Ausgang des Vergleichers (7), dessen zweiter Eingang (82) mit einem Ausgang des ersten Zählers (6) und dessen erster Ausgang (83) mit einem Eingang des ersten Zählers (6) verbunden ist und
daß an dem zweiten Ausgang (84) des zweiten Zählers (STZ) bei Auftreten eines stimmlosen Signales ein Steuerimpuls entnehmbar ist.
VPA 9/644/1002 d
409884/0789
Leerseite
DE19732334459 1973-07-06 1973-07-06 Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung Expired DE2334459C3 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19732334459 DE2334459C3 (de) 1973-07-06 1973-07-06 Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19732334459 DE2334459C3 (de) 1973-07-06 1973-07-06 Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung

Publications (3)

Publication Number Publication Date
DE2334459A1 true DE2334459A1 (de) 1975-01-23
DE2334459B2 DE2334459B2 (de) 1981-07-02
DE2334459C3 DE2334459C3 (de) 1982-03-25

Family

ID=5886153

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19732334459 Expired DE2334459C3 (de) 1973-07-06 1973-07-06 Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung

Country Status (1)

Country Link
DE (1) DE2334459C3 (de)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2316814A1 (fr) * 1975-07-03 1977-01-28 Telettra Lab Telefon Procede et dispositif de detection de la presence et/ou l'absence d'un signal de parole dans des lignes telephoniques
EP0054365A1 (de) * 1980-12-09 1982-06-23 Secretary of State for Industry in Her Britannic Majesty's Gov. of the United Kingdom of Great Britain and Northern Ireland Spracherkennungssystem
GB2357683A (en) * 1999-12-24 2001-06-27 Nokia Mobile Phones Ltd Voiced/unvoiced determination for speech coding

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1186230B (de) * 1961-11-14 1965-01-28 Ibm Verfahren und Anordnung zum automatischen Erkennen gesprochener Woerter
DE1572453A1 (de) * 1967-12-16 1970-07-16 Ibm Schaltungsanordnung zur Analyse und Synthese von Sprachsignalen
DE1926362B2 (de) * 1968-05-27 1971-07-22 Einrichtung zur sprachanalyse und synthese nach dem vocoderprinzip
DE2062589A1 (de) * 1970-12-18 1972-06-29 Siemens Ag Verfahren zur Ermittlung der Grundfrequenz eines wenigstens zeitweise periodischen signals

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1186230B (de) * 1961-11-14 1965-01-28 Ibm Verfahren und Anordnung zum automatischen Erkennen gesprochener Woerter
DE1572453A1 (de) * 1967-12-16 1970-07-16 Ibm Schaltungsanordnung zur Analyse und Synthese von Sprachsignalen
DE1926362B2 (de) * 1968-05-27 1971-07-22 Einrichtung zur sprachanalyse und synthese nach dem vocoderprinzip
DE2062589A1 (de) * 1970-12-18 1972-06-29 Siemens Ag Verfahren zur Ermittlung der Grundfrequenz eines wenigstens zeitweise periodischen signals

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2316814A1 (fr) * 1975-07-03 1977-01-28 Telettra Lab Telefon Procede et dispositif de detection de la presence et/ou l'absence d'un signal de parole dans des lignes telephoniques
EP0054365A1 (de) * 1980-12-09 1982-06-23 Secretary of State for Industry in Her Britannic Majesty's Gov. of the United Kingdom of Great Britain and Northern Ireland Spracherkennungssystem
GB2357683A (en) * 1999-12-24 2001-06-27 Nokia Mobile Phones Ltd Voiced/unvoiced determination for speech coding
EP1111586A3 (de) * 1999-12-24 2002-10-16 Nokia Corporation Verfahren und Vorrichtung zur Sprachkodierung mit Stimmhaft-/Stimmlos-Entscheidung
US6915257B2 (en) 1999-12-24 2005-07-05 Nokia Mobile Phones Limited Method and apparatus for speech coding with voiced/unvoiced determination

Also Published As

Publication number Publication date
DE2334459B2 (de) 1981-07-02
DE2334459C3 (de) 1982-03-25

Similar Documents

Publication Publication Date Title
DE2710877C2 (de) Einbruch-Alarmsystem
DE2816333A1 (de) Verfahren und anordnung zum lesen eines strichcodes
DE69026185T2 (de) Mehrfrequenzsignal-Empfänger und Verfahren zu dessen Erkennung
DE2710834C2 (de) Einbruch-Alarmsystem
DE3102385C2 (de)
DE69325053T2 (de) Verfahren zur Verbesserung der Empfindlichkeit und des Sprachschutzes eines Mehrfrequenzempfängers
DE2515868B2 (de) Vorrichtung zur messung des blutdrucks
DE1572516A1 (de) Schaltungsanordnung fuer die Spracherkennung
DE19961817B4 (de) Frequenzabweichung detektierendes Gerät und Frequenzabweichungs-Detektionsverfahren
DE2334459A1 (de) Unterscheidung zwischen stimmhaften und stimmlosen lauten bei der sprachsignalauswertung
EP1382034B1 (de) Verfahren zur bestimmung von intensitätskennwerten von hintergrundgeräuschen in sprachpausen von sprachsignalen
DE2431458C2 (de) Verfahren und Anordnung zur automatischen Sprechererkennung
DE2750153B2 (de) Verfahren und Vorrichtung zur Auswertung von Garnsignalen zum Erkennen zumindest angenähert periodischer Querschnittsschwankungen an Offenendspinnmaschinen o.dgl
EP0100891A1 (de) Verfahren und Vorrichtung zur Korrektur von Koinzidenzfehlern beim Zählen von Teilchen zweier Sorten
DE2062589A1 (de) Verfahren zur Ermittlung der Grundfrequenz eines wenigstens zeitweise periodischen signals
DE19806787A1 (de) Vorrichtung zur Erkennung oder zur Analyse von Maschinenschäden
DE2712831C3 (de)
DE1122274B (de) Verfahren und Anordnung zur automatischen Erkennung von Sprache
DE2719248C2 (de) Frequenzselektiver Zeichenempfänger für Fernmelde-, insbesondere Fernsprechanlagen
DE1940082A1 (de) Verfahren zum Erkennen von Sprachmerkmalen und deren Aufzeichung mittels einer elektrisch gesteuerten Schreibmaschine
DE2345980C2 (de) Mehrfachausnutzung einer Laufzeitkette für eine Schaltungsanordnung zur Sprachauswertung
DE3411485A1 (de) Verfahren zur erfassung der grenzen von signalen, die vor einem hintergrundsignalgemisch auftreten
DE2313009C2 (de) Anordnung zur Durchführung eines Verfahrens zur Grundfrequenzermittlung mit Ausblendung der Subharmonischen der Grundfrequenz
DE2309785A1 (de) Grundfrequenzermittlung mit gleitendem entscheiderschwellwert
DE2759259A1 (de) Verfahren zur erkennung der frequenz eines binaer frequenzmodulierten signals

Legal Events

Date Code Title Description
AF Is addition to no.

Ref country code: DE

Ref document number: 2062589

Format of ref document f/p: P

C3 Grant after two publication steps (3rd publication)
8340 Patent of addition ceased/non-payment of fee of main patent