[go: up one dir, main page]

DE2233872A1 - Signalanalysator - Google Patents

Signalanalysator

Info

Publication number
DE2233872A1
DE2233872A1 DE2233872A DE2233872A DE2233872A1 DE 2233872 A1 DE2233872 A1 DE 2233872A1 DE 2233872 A DE2233872 A DE 2233872A DE 2233872 A DE2233872 A DE 2233872A DE 2233872 A1 DE2233872 A1 DE 2233872A1
Authority
DE
Germany
Prior art keywords
signal
speech
mean square
root mean
complex
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE2233872A
Other languages
English (en)
Other versions
DE2233872C2 (de
Inventor
Bishnu Saroop Atal
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
Western Electric Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Western Electric Co Inc filed Critical Western Electric Co Inc
Publication of DE2233872A1 publication Critical patent/DE2233872A1/de
Application granted granted Critical
Publication of DE2233872C2 publication Critical patent/DE2233872C2/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

WESTERN ELECTRIC COMPANY Incorporated B. S. Atal - 5
New York, N.Y., 10007, USA Signalanalysator
Die Erfindung betrifft einen Signalanalysator für die Bestimmung der Grundwellenperiode eines komplexen Signals, bei dem ein im wesentlichen die Formantstruktur eines komplexen Signals darstellendes Signal erzeugt wird.
Einrichtungen für die Verringerung der Kanalkapazität, die für die Übertragung komplexer Signale erforderlich sind, wie beispielsweise Sprachsignale, wurden bereits vorgeschlagen. Die meist bekannte Einrichtung dieser Art ist der Vocoder. Ferner wurden kürzlich Techniken beschrieben, die den Signalen inhärente Redundanz durch die Verwendung einer linearen Vorhersage-Technik beseitigen. Bei allen diesen genannten Einrichtungen wird ein Sprachsignal analysiert, um seine kennzeichnenden Charakteristika zu bestimmen, woraufhin dann kodierte Information bezüglich dieser Charakteristika anstelle des Sprachsignals selbst übertragen wird.
Auf der Empfangsseite wird dann aus der kodierten Information ein künstliches Sprachsignal erzeugt.
Im allgemeinen wird bei jeder Systemart für eine Bandbreitenkompression von kodierter Signalinformation verwendet. Alle verwenden jedoch in Wahrheit ein Merkmal des Sprachsignals, nähmlich seine Grundfrequenz. Diese Charakteristik bezeichnet die Grundfrequenz, mit der die Stimmbänder während der Erzeugung verschiedener stimmhafter Sprachsignale vibrieren. Die meisten Systeme für eine Sprachbandbreitenkompression verwenden ferner kodierte Information, um ein Sprachsignal als stimmhaft oder stimmlos zu kennzeichnen. Einige dieser Systeme kombinieren zwei Informationsformen,, so daß das Sprachgrundsignal inhärent die Stimmhaftbedingung spezifiziert.
Es wurden ferner verschiedene Vorschläge für das automatische Messen und Kodieren der Grundfrequenzmerkmale eines Sprachsignals vorgeschlagen und in der Praxis verwendet. Einige basieren auf einer einfachen Filtertechnik, andere auf der Signalkorrelation, andere auf der formanten Feststellung und Beobachtung und andere auf einer Transformation des Logarithmus des Sprach-
? 0 fHl H Π / 0 8 7 8
signalspektrums, dem sogenannten Cepstrum des Signals, Alle genannten Anordnungen arbeiten auf bestimmte Weise mit dem Sprachsignal selbst, um Spitzenwerte im Signal oder deren Multifizierungen aufzufinden, die die Sprachgrundcharakteristik identifizieren. Unglücklicherweise sind Spitzenwerte der Formanten, insbesondere des ersten Formanten eines Sprachsignals oft stärker, als ein Spitzenwert, der zur Angabe der Sprachgrundfrequenz erzeugt wurde. Wenn die beiden Spitzenwerte sehr dicht beieinander liegen, ist es sehr schwer, festzustellen, welcher für die Sprachgrundwelle repräsentativ ist. Daher unterliegen selbst komplizierte Grundfrequenzdedektoren diesem Fehler und charakterisieren nicht immer korrekt die Grundfrequenz eines Signals.
Die Erfindung hat sich daher die Aufgabe gesetzt, die vorstehend genannten Schwierigkeiten zu vermeiden und insbesondere eine Einrichtung anzugeben, die eine weitgehend fehlerfreie Sprachgrundfrequenzmessung gestattet.
Für einen Signalanalysator für die Bestimmung der GrundweUenp^- riode eines komplexen Signals, bei dem ein im wesentlichen die Formantstruktur eines komplexen Signals darstellendes Signal
209883/QS78
erzeugt wird, besteht die Erfindung darin, das ein Subtrahiernetzwerk für die Subtraktion eines im wesentlichen die Formantstruktur darstellenden Signals von einem komplexen Signal zur Bildung eines Differenz signals vorgesehen ist und das die Grundfrequenz des Differenz Signals bestimmt und als Angabe der Grundwellenperiode des komplexen Signals verwendet wird.
Weitere Merkmale, vorteilhafte Ausgestaltungen und Weiterbildungen des Gegenstandes der Erfindung sind den Unter ansprächen zu entnehmen.
Die Vorteile, der Erfindung, die weitgehend fehlerfreie Bestimmung der Sprachgrundfrequenz basieren auf der Analyse eines komplexen Sprachsignals zur Bestimmung seiner Grundfrequenz. Diese Analyse beruht auf der Analyse des Fehlers zwischen einem vorhergesagten Wert des Sprachsignals, basierend auf seinen früheren Abtastwerten und seinem im Augenblick gerade vorliegenden Wert. Das Zeitintervall, das durch eine Anzahl von Abtastwerten repräsentiert und für die Gewinnung des Vorhersagewertes verwendet wird, ist in typischerweise eine Millisekunde lang. Aufgrund des Kurzzeitspeichers, der in dem Vorhersagoprozess verwendet wird,
2098R3/fl«7fl
stellen die vorher ge sagten Signalwerte in großem Maße die Formantstruktur des Sprachsignals dar. Die Grundfrequenzanalyse einrichtung der Erfindung ist besonders effektiv, da bei der Erzeugung eines Differenzsignals, d.h. des Vorhersagefehlersignals, die Formantstruktur des Signals vom Eingangssignal entfernt wurde. Da jedoch die Grundfrequenz der Sprachsignale in typischer Weise in einem Bereich von 3 msek. bis 20 msek. liegt, ist die Vorhersage der Grundfrequenzstruktur, basierend auf 1 msek. eines vergangenen Sprachabschnittes vollständig vernachlässigbar. Daher wird die Grundfrequenzinformation in dem Vorhersagefehlersignal zurückgehalten. Deshalb gibt es auch nur eine geringe oder garkeine Rückwirkung von der Formantstruktur, und die Spitzenabtrennoperation ist bei der Erzeugung eines Meßwertes der Sprachgrundfrequenzcharakteristik des Eingangs signals wirksam.
Ein weiterer Vorteil der Erfindung basiert auf der zusätzlichen Verwendung von Vorhersagefehlerabtastungen, um ein Stimmhaft /Stimmlos-Unterscheidungssignal zu erzeugen. Die Stimmhaftentscheidung wird abgeleitet aus dem Verhältnis des quadratischen Mittelwertes der Eingangssignalabtastwerte zu dem quadratischen Mittelwert der entsprechenden Vorhersagefehlerabtastwerte.
209B8370878
Im folgenden wird die Erfindung anhand der Figuren beispielsweise näher erleutert. Es zeigen:
Fig. 1 das Blockschaltbild eines Sprachsignalanalysators, daß das Prinzip der Erfindung verdeutlicht und
Fig. 2 eine Darstellung der Wellenform eines stimmhaften Sprachsignals, der Positionen festgestellter Grundfrequenzimpulse in dem stimmhaften Sprachsignal (vertikale Linien) und eines stimmlosen Sprachsegments.
Ein Signalanalysator, der das Prinzip der Erfindung beinhaltet, ist in Fig. 1 dargestellt. Die Sprachsignale, die von einer beliebigen Quelle geliefert werden, werden zu dem Analysator übertragen und durch ein Tiefpassfilter 10 geschleußt. Das Filter 10 hat eine typische Grenzfrequenz in der Gegend von 5 kHz. Das sich ergebende Signal wird dann mit einer Frequenz von etwa 10 kHz im Abtaster 11 abgetastet, wobei dieser Abtastvorgang von den Signalen des Taktgebers 12 gesteuert wird. Die Sprachabtast-
209883/0878
werte, s , die auf diese Weise abgeleitet werden, werden zu einer Speichereinheit 13 übertragen, die diese Signale geordnet speichert und zwar in typischen Blöcken von 200 Abtastungen, d.h. S1, s , ..., S. Die Blöcke oder Rahmen von Abtastwerten *
Xu uUU * '
werden periodisch aus der Speichereinheit 13 entnommen, beispielsweise ebenfalls von einem Signal des Taktgehers 12 gesteuert und zu einer adaptiven Vorhersageschaltung 14, einem. Vorhersage-Parameterrechner und zu einem Subtrahiernetzwerk 16 übertragen.
Die adaptive Vorhers age schaltung 14 bearbeitet die angelieferten Signalabtastwerte, um den augenblicklichen Wert jedes Abtastwertes auf der Basis einer gewichteten Summation einer Anzahl von früheren Abtastwerten vorher zusagen. Die Vorhers ageoperation erfolgt auf der Basis Abtastwert zu Abtastwert, und die Vorhersageschaltung 14 wird periodisch mit einem neuen Rahmen von Abtastungen von der Speiche reinheit 13 beschickt. Eine für die Verwendung in dem System gemäß der vorliegenden Erfindung geeignete adaptive Vorhersageschaltung ist beispielsweise in der US-PS 3 631 820 ausführlich beschrieben.
Zur Anpassung des sich konstant ändernden Charakters des Eingangssprachsignals, wird die adaptive Vorhers age schaltung 14 so gesteuert, daß sie sich an den laufenden Signalzustand anpasst. Es hat sich als genügend erwiesen, die Werte der verwendeten Parameter nach zu st'ellen, um die Vorher sage schaltung in Intervallen zu steuern, die mit der Grundwellenperiode des Signals vergleichbar sind. Da das exakte Grundwellenintervall nicht zur Verfugung steht (obwohl das Grundfrequenzausgangssignal des Systems in einer Rückkoppelanordnung zur Annäherung des Intervalls einer späteren Grundwellenperiode verwendet werden kann), ist eine Nachstellung der Parameterwerte in Intervallen von etwa der Zeit von 200 Abtastungen vollständig ausreichend. Dieses entspricht einem Zeitintervall von etwa 20 msek.
Der Vorhersage-Parameterrechner 15 bearbeitet so Sprachabtastwerte der Speichereinheit 13, um eine Folge von Parametersignalen a = a , a , ... a zu erzeugen, die periodisch zur Nachstellung \ & η
der Vorhers age schaltung 14 verwendet werden. Die Parameterwerte a werden so ausgewählt, daß sie den quadratischen Mittelwert-Vorhersagefehler des Systems minimal halten. Eine ausführliche Erläuterung der Beziehung der Parametersignale a zu dem Ein-
209883/087B
gangssignal, ihrer Erzeugung und die Art in der sie zur Steuerung der Vorhersageschaltung verwendet werden,, werden ausführlich in der obengenannten US-Patentschrift erläutert. Die Parametersignale des Vorhersage-Parameterrechners 15 werden noch vor dem Zeitpunkt erzeugt, zu dem ein Signalblock in der Vorhersageschaltung 14 verarbeitet wird., und zwar wegen der der Vorhersageoperation inhärenten Verzögerung. In typischer Weise werden die Parametersteuersignale innerhalb eines Intervalls erzeugt, daß der Zeit von annähernd 60 Abtastungen entspricht.
Die Abtastwerte, die von der adaptiven Vorhersageschaltung 14 erzeugt werden, werden in dem Subtrahiernetzwerk 16 von dem. tatsächlichen Wert der entsprechenden Signalabtastungen, die von der Speichereinheit 13 zu dem Subtrahiernetzwerk 16 übertragen werden, subtrahiert. Das sich ergebende Differenz signal repräsentiert den ' Fehler bei der Vorhersage des Signalwertes. Dieses Signal wird daher "Vorhersagefehler" genannt. Offensichtlich wird eine geeignete Verzögerung vorgesehen, beispielsweise für das Auslesen der Abtastwerte aus der Speichereinheit 13 oder bei ihrer Abgabe an das Subtrahierhetzwert 16, damit für die Vervollständigung der Vorhersageoperation genügend Zeit zur Verfügung steht. Natürlich werden
209RR3/n878
alle hier beschriebenen Operationen auf konventionelle Weise synchron ausgeführt.
Es ist für die genannten Operationen von Bedeutung, das die Signalabtastwerte weitgehend auf der Basis ihrer formanten Zugehörigkeit vorhergesagt werden. Vorhergesagte Signale stellen daher im wesentlichen die Formantstruktur des Eingangs signals dar. Da die vorhergesagten Signalwerte von den tatsächlichen Signalwerten subtrahiert werden, ist das Vorhersagefehlersignal am Ausgang des Subtrahiernetzwerkes 16 im wesentlichen frei von jeglicher formanten Information. Dennoch hat sich das Vorher sage fehler signal zur Bewahrung und Bezeichnung des Grundfrequenzcharakters des übertragenen Signals als notwendig erwiesen.
Die Vorhersagefehlersignale der Subtrahierschaltung 16 werden über das Tiefpassfilter 17 geleitet. Dieses Filter 17 besitzt eine relativ niedrige Grenzfrequenz, da die Sprachgrundfrequenz des anliegenden Signals im allgemeinen im unteren Bereich des Bandes liegt. Die Beseitigung höherer Frequenzanteile hilft bei der Isolation des Grundfrequenzsignals.
Gemäß der Erfindung werden die Positionen der individuellen Grund-
20988 3/0878
frequenzimpulse in dem übertragenen Signal dadurch bestimmt, daß die Abtastwerte lokalisiert werden, für die der Vorhersagefehler groß ist. Die von dem Filter 17 übertragenen Abtastwerte besitzen daher Amplituden, die der Differenz zwischen dem üb'ertragenen Signalabtastwert und dem vorher ge sagten Signal proportional sind. Es ist daher notwendig nur die Grundfrequenz des Vorhersage (Fehler)-Signäls zu suchen. Dieses kann mit jedem beliebigen Grundfrequenzdedektor 18 durchgeführt werden. Ein geeigneter Dedektor besteht aus einem Halbwellengleichrichter 19, der zur Aufrechterhaltung hur der positiven Spitze des Signals verwendet wird, um spätere Operationen zu vereinfachen. Das gleichgerichtete Signal wird dann zu dem Spitzenabtrenner 20 übertragen, der den größten Abtastwert in jedem Signalrahmen sucht. Derartige Spitzenabtrenner sind ansich bekannt und werden häufig in Grundfrequenzdedektoren verwendet, insbesondere in solchen des Cepstrumtyps. Auf diese Weise ermittelte Spitzensignale werden zu einem Schwellenwertdedektor 21 übertragen, der auf einen Pegel eingestellt ist bei dem kleinere Spitzen am Ausgang des Analysators unterdrückt werden. Der Schwellenwert ist so eingestellt, daß er in die festgestellten Waren Grundfrequenzspitzen, beispielsweise aus den Erfahrungswerten anpasst. Die sich ergebende
1 9
Folge von Grundfrequenzimpulsen ist für die Grundfrequenz oder Periode des anliegenden Sprachsignals indikativ und sie kann auf jede gewünschte Weise weiter verwendet werden.
Alternativ hierzu kann; wie von früher schon bekannt der Grundfre-. quenzdedektor einen Autokorrelator enthalten, dem ein Spitzenabtrenner und ein Schwellenwertdedektor nachfolgen.
Fig. 2 zeigt ein typisches Intervall des Sprachsignals. In der Zeile A ist ein stimmhaftes Sprachsegment gezeigt. Die Zeile B illustriert die Impulsfolge, die von dem Grundfrequenzdedektor 18 als Ausgangs signal des Analysators erzeugt wurde. In der Zeile C ist dagegen ein typisches stimmloses Sprachsegment dargestellt.
Um sicherzustellen, daß eine klare Unterscheidung zwischen stimmhaften und stimmlosen Signalsegmenten möglich ist, wird gemäß der Erfindung ein Stimmhaft-/Stimnalos-Unterscheidungssignal erzeugt. Hiernach basiert die Stimmhaft-/Stimmlos-Entscheidung auf dem Verhältnis des quadratischen Mittelwertes der Sprachabtastwerte zu dem quadratischen Mittelwert der Vorhersagefehlerabtastwerte. Es hat sich gezeigt, daß dieses Verhältnis für stimmlose Sprachab-
9883/0*78
schnitte beträchtlich kleiner ist als für stimmhafte Sprachabschnitte und zwar in typischer Weise um einen Faktor von etwa 10.
Daher werden die Sprachabtastwerte von dem Abtastwert zu. dem quadratischen Mittelwertnetzwerk 22 und die Vorhersagefehlerabtastwerte von dem Subtrahiernetzwerk 16 zu dem quadratischen Mittelwertnetzwerk 23 übertragen. Die Netzwerke für die Erzeugung eines Signals, das den Mittelwert der Folge von Abtastwerten proportional ist, sind ansich bekannt und sie werden häufig in Einrichtungen für die akustische Signalverarbeitung verwendet. Ein typisches Netzwerk enthält eine Einrichtung zur Erzeugung eines Signals, das dem Quadrat jedes Signalabtastwertes proportional ist, ein Addiernetzwerk für die Aufsummierung einer Folge von quadratischen Signalwerten und ein Teilernetzwerk für die Erzeugung eines Signals, das einen Durchschnittswert oder Mittelwert des auf summierten quadratischen Signals proportional ist.
Zwei Signale, jeweils dem quadratischen Mittelwert von Sprachabtastwerten und dem quadratischen Mittelwert der Vorhersagefehler Abtastwerte proportional, werden zu dent Teiler 24 übertragen,
20 9 8B37 Π8 78
der an seinem Ausgang ein Signal erzeugt, das dem Quotienten der beiden Signalwerte entspricht. Dieses quotienten Signal wird dann zu dem Schwellenwertdedektor 25 übertragen, der ein erstes Signal für Quotientenwerte größer als 10, als Angabe für ein stimmhaftes Signalintervall und ein zweites Signal für Quotienten kleiner als 10 erzeugt, das als Angabe für ein stimmloses Signalintervall dient. Die Ausgangs signale des Dedektors 25 können in jeder gewünschten Weise verwendet werden, um den Stimmcharakter des Eingangssignals anzugeben.
Die Einrichtung zur Grundfrequenzbestimmung gemäß der Erfindung verbessert zusammen mit der Stimmart Entscheidungseinrichtung weitgehend die Zuverlässigkeit, mit der zwei wichtige Sprachcharakteristiken bestimmt werden können. Diese verbesserte Zuverlässigkeit stammt in erster Linie von dem tatsächlichen Fehlen der Formantenstruktur in dem Signal zu dem Zeitpunkt, zu dem die Grundfrequenzmessung durchgeführt wird. Darüberhinaus ist der Grundfrequenzdedektor gemäß der Erfindung insbesondere für eine Anwendung in einem Sprachübertragung- oder Sprachanalysesystem geeignet, indem eine lineare Vorhersageeinrichtung verwendet wird. Für diesen Fall ist es offensichtlich, daß das Vorhersagefehlersignal
209883/0 878
das zu dem Subtrahiernetzwerk 16 übertragen wird, von der Vorhersageschaltung erzeugt wird, die bei der Kodierung der Sprachsignale verwendet wird.
Ferner ist es offensichtlich, daß das Stimme ntseheidungssignal im Zusammenhang mit anderen Kriterien verwendet werden kann, wie beispielsweise der spektralen Balance der niedrigen Frequenzen zu den höheren Frequenzen., um die Stimmhaft- /Stimmlos-Entscheidung noch zuverlässiger zumachen.
209883/087

Claims (6)

PATENTANSPRÜCHE
1. ) Signalanalysator für die Bestimmung der Grundwellenperiode eines komplexen Signals, bei dem ein im wesentlichen die Formantstruktur eines komplexen Signals darstellendes Signal erzeugt wird, dadurch gekennzeichnet, das ein Subtrahiernetzwerk (16; Fig. 1) für die Subtraktion eines im wesentlichen die Formantstruktur darstellenden Signals (am Ausgang von 14) von einem komplexen Signal (am Ausgang von 13) zur Bildung eines Differenz signals vorgesehen ist und das die Grundfrequenz des Differenzsignals (in 18) bestimmt und als Angabe der Grundwellenperiode des komplexen Signals verwendet wird.
2. Signalanalysator nach Anspruch 1, dadurch gekennzeichnet, das eine adaptive Vorher sage schaltung (14; Fig. 1) vorgesehen ist, die ein Signal erzeugt, das für die Formantstruktur eines komplexen
209883/Π878
Signals repräsentativ ist.
3. Signalanalysator nach Anspruch 2,
dadurch gekennzeichnet,
das die adaptive Vorhers age schaltung (14; Fig. 1) eine Schaltung für die Absetzung der gerade vorliegenden Amplitude eines Sprachsignals in Relation zu vorhergehenden Amplituden des Sprachsignals enthält.
4. Signalanalysator nach einem oder mehreren der Ansprüche 1-3, dadurch gekennzeichnet,
das ein Schwellenwertdedektor (21; Fig. 1) vorgesehen ist, der auf Spitzenamplituden des Differenzsignals anspricht, um die Grundperiode des Differenz signals zu bestimmen, die eine Angabe der Grundperiode des komplexen Signals darstellt.
5. Signalanalysator nach einem oder mehreren der Ansrpüche 1-4, dadurch gekennzeichnet,
das ein erstes quadratisches Mittelwertnetzwerk (22; Fig. 1) für die Eürzeugung eines ersten Signals vorgesehen ist, das proportional '/,u eiern quadratischen Mittelwert der Sprachwelle ist, das ferner ein /.Wt-iu'·. quadratisches Mittelwertnetzwerk (23) vorgesehen ist, da.; ein
20'JH 83/0878
Signal erzeugt, das dem quadratischen Mittelwert des Differenzsignals proportional ist und das eine Vergleichsschaltung (Teiler
24) vorgesehen ist, der ein Signal erzeugt, daß dem Verhältnis des
ersten quadratischen Mittelwertsignals zu dem zweiten quadratischen Mittelwertsignal proportional ist.
6. Signalanalysator nach einem oder mehreren der Ansprüche 1-5, dadurch gekennzeichnet,
das die Werte des Verhältnisses der quadratischen Mittelwertsignale, die größer sind als ein vorgegebener Schwellenwert, zur Angabe verwendet werden, daß das Sprachsignal ein stimmhaftes ist und das die Werte des Verhältnisses der quadratischen Mittelwertsignale, die kleiner sind, als der vorgegebene Schwellenwert zur Angabe dienen, daß das Sprachsignal stimmlos ist.
2 0 9 B R 3 / Π 8 7 R
DE2233872A 1971-07-09 1972-07-10 Verfahren zur Bestimmung der Grundwellenperiode eines Sprachsignals Expired DE2233872C2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US16117371A 1971-07-09 1971-07-09

Publications (2)

Publication Number Publication Date
DE2233872A1 true DE2233872A1 (de) 1973-01-18
DE2233872C2 DE2233872C2 (de) 1983-11-03

Family

ID=22580131

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2233872A Expired DE2233872C2 (de) 1971-07-09 1972-07-10 Verfahren zur Bestimmung der Grundwellenperiode eines Sprachsignals

Country Status (6)

Country Link
US (1) US3740476A (de)
JP (2) JPS5524118B1 (de)
CA (1) CA967285A (de)
DE (1) DE2233872C2 (de)
FR (1) FR2145501B1 (de)
NL (1) NL7209311A (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2636032A1 (de) * 1975-08-22 1977-02-24 Nippon Telegraph & Telephone Schaltungsanordnung zum extrahieren der grundfrequenz aus einem sprachsignal
DE2649259A1 (de) * 1976-10-29 1978-05-03 Tekade Felten & Guilleaume Verfahren zur automatischen verarbeitung von gestoerter telefonsprache

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3979557A (en) * 1974-07-03 1976-09-07 International Telephone And Telegraph Corporation Speech processor system for pitch period extraction using prediction filters
US4074069A (en) * 1975-06-18 1978-02-14 Nippon Telegraph & Telephone Public Corporation Method and apparatus for judging voiced and unvoiced conditions of speech signal
US4038495A (en) * 1975-11-14 1977-07-26 Rockwell International Corporation Speech analyzer/synthesizer using recursive filters
US4070709A (en) * 1976-10-13 1978-01-24 The United States Of America As Represented By The Secretary Of The Air Force Piecewise linear predictive coding system
US4133976A (en) * 1978-04-07 1979-01-09 Bell Telephone Laboratories, Incorporated Predictive speech signal coding with reduced noise effects
US4164626A (en) * 1978-05-05 1979-08-14 Motorola, Inc. Pitch detector and method thereof
US4280387A (en) * 1979-02-26 1981-07-28 Norlin Music, Inc. Frequency following circuit
JPS5918717B2 (ja) * 1979-02-28 1984-04-28 ケイディディ株式会社 適応形ピツチ抽出方式
US4383135A (en) * 1980-01-23 1983-05-10 Scott Instruments Corporation Method and apparatus for speech recognition
US4472832A (en) * 1981-12-01 1984-09-18 At&T Bell Laboratories Digital speech coder
USRE32580E (en) * 1981-12-01 1988-01-19 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech coder
JPS58140798A (ja) * 1982-02-15 1983-08-20 株式会社日立製作所 音声ピツチ抽出方法
JPS5922602U (ja) * 1982-08-04 1984-02-13 長山 勉 浴室における幼児等の洗髪台
US4561102A (en) * 1982-09-20 1985-12-24 At&T Bell Laboratories Pitch detector for speech analysis
JPS6050901U (ja) * 1983-09-16 1985-04-10 ▲いざさ▼ 秀之 乳幼児用エヤ−マツト
US4675863A (en) * 1985-03-20 1987-06-23 International Mobile Machines Corp. Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels
US4879748A (en) * 1985-08-28 1989-11-07 American Telephone And Telegraph Company Parallel processing pitch detector
US4827517A (en) * 1985-12-26 1989-05-02 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
USRE34247E (en) * 1985-12-26 1993-05-11 At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
US5010574A (en) * 1989-06-13 1991-04-23 At&T Bell Laboratories Vector quantizer search arrangement
FR2670313A1 (fr) * 1990-12-11 1992-06-12 Thomson Csf Procede et dispositif pour l'evaluation de la periodicite et du voisement du signal de parole dans les vocodeurs a tres bas debit.
SE467806B (sv) * 1991-01-14 1992-09-14 Ericsson Telefon Ab L M Metod att kvantisera linjespektralfrekvenser (lsf) vid beraekning av parametrar foer ett analysfilter ingaaende i en talkodare
US5353372A (en) * 1992-01-27 1994-10-04 The Board Of Trustees Of The Leland Stanford Junior University Accurate pitch measurement and tracking system and method
US5546383A (en) * 1993-09-30 1996-08-13 Cooley; David M. Modularly clustered radiotelephone system
US5471527A (en) * 1993-12-02 1995-11-28 Dsc Communications Corporation Voice enhancement system and method
US5586126A (en) * 1993-12-30 1996-12-17 Yoder; John Sample amplitude error detection and correction apparatus and method for use with a low information content signal
SE508788C2 (sv) * 1995-04-12 1998-11-02 Ericsson Telefon Ab L M Förfarande att bestämma positionerna inom en talram för excitationspulser
US5717819A (en) * 1995-04-28 1998-02-10 Motorola, Inc. Methods and apparatus for encoding/decoding speech signals at low bit rates
US6140568A (en) * 1997-11-06 2000-10-31 Innovative Music Systems, Inc. System and method for automatically detecting a set of fundamental frequencies simultaneously present in an audio signal
US7124075B2 (en) * 2001-10-26 2006-10-17 Dmitry Edward Terez Methods and apparatus for pitch determination
JP2004297273A (ja) * 2003-03-26 2004-10-21 Kenwood Corp 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム
JP3827317B2 (ja) * 2004-06-03 2006-09-27 任天堂株式会社 コマンド処理装置
AU2009295251B2 (en) * 2008-09-19 2015-12-03 Newsouth Innovations Pty Limited Method of analysing an audio signal
US11443761B2 (en) 2018-09-01 2022-09-13 Indian Institute Of Technology Bombay Real-time pitch tracking by detection of glottal excitation epochs in speech signal using Hilbert envelope

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DD49355A (de) *
US2221523A (en) * 1938-03-17 1940-11-12 Ora L Railsback Pitch determining apparatus
GB796676A (en) * 1954-10-20 1958-06-18 Western Electric Co Improvements in or relating to circuits for the analysis and synthesis of speech currents
US2927969A (en) * 1954-10-20 1960-03-08 Bell Telephone Labor Inc Determination of pitch frequency of complex wave
DE1572520A1 (de) * 1967-06-08 1970-02-19 Telefunken Patent Verfahren zur Erkennung von Sprachlauten
CA844193A (en) * 1970-06-09 Western Electric Company, Incorporated Predictive coding of speech signals
US3530243A (en) * 1967-06-23 1970-09-22 Standard Telephones Cables Ltd Apparatus for analyzing complex signal waveforms
US3631520A (en) * 1968-08-19 1971-12-28 Bell Telephone Labor Inc Predictive coding of speech signals
DE2062589A1 (de) * 1970-12-18 1972-06-29 Siemens Ag Verfahren zur Ermittlung der Grundfrequenz eines wenigstens zeitweise periodischen signals

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2732424A (en) * 1956-01-24 oliver
US3026375A (en) * 1958-05-09 1962-03-20 Bell Telephone Labor Inc Transmission of quantized signals
US3405237A (en) * 1965-06-01 1968-10-08 Bell Telephone Labor Inc Apparatus for determining the periodicity and aperiodicity of a complex wave
US3420955A (en) * 1965-11-19 1969-01-07 Bell Telephone Labor Inc Automatic peak selector
US3437757A (en) * 1966-06-15 1969-04-08 Bell Telephone Labor Inc Speech analysis system

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DD49355A (de) *
CA844193A (en) * 1970-06-09 Western Electric Company, Incorporated Predictive coding of speech signals
US2221523A (en) * 1938-03-17 1940-11-12 Ora L Railsback Pitch determining apparatus
GB796676A (en) * 1954-10-20 1958-06-18 Western Electric Co Improvements in or relating to circuits for the analysis and synthesis of speech currents
US2927969A (en) * 1954-10-20 1960-03-08 Bell Telephone Labor Inc Determination of pitch frequency of complex wave
DE1572520A1 (de) * 1967-06-08 1970-02-19 Telefunken Patent Verfahren zur Erkennung von Sprachlauten
US3530243A (en) * 1967-06-23 1970-09-22 Standard Telephones Cables Ltd Apparatus for analyzing complex signal waveforms
US3631520A (en) * 1968-08-19 1971-12-28 Bell Telephone Labor Inc Predictive coding of speech signals
DE2062589A1 (de) * 1970-12-18 1972-06-29 Siemens Ag Verfahren zur Ermittlung der Grundfrequenz eines wenigstens zeitweise periodischen signals

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Communications of the ACM, Vol. 10, Nr. 6, Juni 1967, S. 343-348 *
US-IEEE Transactions on Audio and Electroacoustics, Vol. AU-16, Juni 1968, S. 262-266 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2636032A1 (de) * 1975-08-22 1977-02-24 Nippon Telegraph & Telephone Schaltungsanordnung zum extrahieren der grundfrequenz aus einem sprachsignal
DE2649259A1 (de) * 1976-10-29 1978-05-03 Tekade Felten & Guilleaume Verfahren zur automatischen verarbeitung von gestoerter telefonsprache

Also Published As

Publication number Publication date
JPS5524118B1 (de) 1980-06-26
NL7209311A (de) 1973-01-11
JPS5774800A (en) 1982-05-11
US3740476A (en) 1973-06-19
FR2145501A1 (de) 1973-02-23
DE2233872C2 (de) 1983-11-03
CA967285A (en) 1975-05-06
FR2145501B1 (de) 1976-08-13

Similar Documents

Publication Publication Date Title
DE2233872A1 (de) Signalanalysator
DE69529356T2 (de) Wellenforminterpolation mittels Zerlegung in Rauschen und periodische Signalanteile
DE69614989T2 (de) Verfahren und Vorrichtung zur Feststellung der Sprachaktivität in einem Sprachsignal und eine Kommunikationsvorrichtung
DE68910859T2 (de) Detektion für die Anwesenheit eines Sprachsignals.
DE68912692T2 (de) Zur Sprachqualitätsmodifizierung geeignetes Übertragungssystem durch Klassifizierung der Sprachsignale.
DE69615119T2 (de) Relaxation CELP (RCELP) Koder
DE2945414C2 (de) Sprachsignal-Voraussageprozessor und Verfahren zur Verarbeitung eines Sprachleistungssignals
DE3306730C2 (de)
DE69121312T2 (de) Geräuschsignalvorhersagevorrichtung
DE69530442T2 (de) Vorrichtung zur Sprachkodierung
DE69412913T2 (de) Verfahren und Vorrichtung für digitale Sprachkodierung mit Sprachsignalhöhenabschätzung und Klassifikation in digitalen Sprachkodierern
DE69009545T2 (de) Verfahren zur Sprachanalyse und -synthese.
DE69322313T2 (de) C.E.L.P. - Vocoder
EP1386307B1 (de) Verfahren und vorrichtung zur bestimmung eines qualitätsmasses eines audiosignals
DE69329569T2 (de) Digitale Kodierung von Sprachsignalen
DE2229149A1 (de) Verfahren zur Übertragung von Sprache
DE69223335T2 (de) Sprachkodiersystem
DE2626793B2 (de) Elektrische Schaltungsanordnung zum Bestimmen des stimmhaften oder stimmlosen Zustandes eines Sprachsignals
DE69426860T2 (de) Sprachcodierer und Verfahren zum Suchen von Codebüchern
DE2636032C3 (de) Elektrische Schaltungsanordnung zum Extrahieren der Grundschwingungsperiode aus einem Sprachsignal
DE19722705A1 (de) Verfahren zur Abschätzung der Verstärkung zur Sprachkodierung
DE68917584T2 (de) Zur Sprachqualitätsverbesserung geeignetes Kodiergerät unter Anwendung einer Doppelanlage zur Pulserzeugung.
DE3884839T2 (de) Codierung von akustischen Wellenformen.
DE69017842T2 (de) Verfahren und Einrichtung zur Codierung von Prädiktionsfiltern in Vocodern mit sehr niedriger Datenrate.
DE3043516C2 (de) Verfahren und Vorrichtung zur Spracherkennung

Legal Events

Date Code Title Description
E77 Valid patent as to the heymanns-index 1977
OD Request for examination
D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee