[go: up one dir, main page]

DE1572452A1 - Arrangement for determining the voiced components of speech sounds - Google Patents

Arrangement for determining the voiced components of speech sounds

Info

Publication number
DE1572452A1
DE1572452A1 DE19671572452 DE1572452A DE1572452A1 DE 1572452 A1 DE1572452 A1 DE 1572452A1 DE 19671572452 DE19671572452 DE 19671572452 DE 1572452 A DE1572452 A DE 1572452A DE 1572452 A1 DE1572452 A1 DE 1572452A1
Authority
DE
Germany
Prior art keywords
speech
energy
voiced
arrangement according
rectified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE19671572452
Other languages
German (de)
Inventor
King Jun John Hewitt
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE1572452A1 publication Critical patent/DE1572452A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R23/00Arrangements for measuring frequencies; Arrangements for analysing frequency spectra
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Monitoring And Testing Of Exchanges (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

1,139,017. Speech recognition. INTERNATIONAL BUSINESS MACHINES CORP. 15 Sept., 1967 [29 Sept., 1966], No. 42164/67. Heading G4R. [Also in Division H4] In a speech analysis system, a signal representative of the harmonic energy of a speech signal is obtained from the sum of rectified signals each representing a respective harmonic content of the speech signal. Speech is split by filters at 3 having passbands of width 300 hz and centre frequencies as shown, the filter outputs being rectified at 4, passed through low-pass filters (15 hz) at 25 and summed at 29 to give the total spectral energy at 32. The outputs of filters 4 are also passed to 9 where they are summed, band-pass filtered (70 hz to 150 hz viz fundamental) at 13, fullwave rectified at 14 and low-pass filtered (15 hz) at 15, to give the harmonic energy at 16 (voiced sound). The energy signals at 32, 16 are compared at 17 to produce a voiced/unvoiced binary indication at 20d, the gains of the summing amplifiers 10, 30 being appropriately chosen for this purpose.

Description

V- Γ T L1THl;1 -.",fci.-,'!!5, Internationale Bärn-Sfatichincn Ceselhcfiaft mhfl V- Γ TL 1 THl; 1 -. ", Fci.-, '!! 5 , Internationale Bärn-Sfatichincn Ceselhcfiaft mhfl

' . - Böblingen den 1. August 1969 '. - Böblingen on August 1st, 1969

bi-spbi-sp

Anmelderin: International Business MachinesApplicant: International Business Machines

Corporation, Armonk, N. Y. LQCorporation, Armonk, N.Y. LQ

Amtliches Aktenzeichen P 15 72 452.4Official file number P 15 72 452.4

Aktenzeichen der Anmelderin: Docket 6667Applicant's file number: Docket 6667

Anordnung zur Bestimmung der stimmhaften Anteile von SprachlautenArrangement for determining the voiced components of speech sounds

Die Erfindung betrifft die Sprachanalyse und insbesondere eine Anordnung zur Bestimmung der stimmhaften Anteile von Sprachlatiten.The invention relates to speech analysis and, more particularly, to an arrangement to determine the voiced proportions of language latites.

In der Technik der Spracherkennung wurde die Bestimmung der stimmhaften Energie als Hilfsmittel bisher kaum in Erwägung gezogen. Zwei Ansätze in dieser Richtung sind bekannt; der eine zieht lediglich das untere Ende des Frequenzbandes zur Energiebestimmung heran, der andere macht von einem einzigen breiten Bandfilter Gebrauch, das das gesamte Frequenzband der Sprache überdeckt. Beim ersten bleibt ein grosser Teil des harmonischen Energieanteils verborgen und der andere ist wegen der grossen .Variation der Amplituden der Harmonischen sehr unzuverlässig. Bei der vorliegenden Erfindung wird das Sprachspektrum durch einen Vielzahl von Bandpässen analysiert, deren kleinste Bandbreite grosser ist als die höchste Grundfrequenz ,In the technology of speech recognition, the determination of the voiced So far, energy has hardly been considered as an aid. Two approaches in this direction are known; one just pulls the lower end of the frequency band for energy determination, the other makes of a single wide band filter that covers the entire frequency band of speech. With the first, a large part of the harmonic remains Energy component hidden and the other is very unreliable because of the large .Variation of the amplitudes of the harmonics. In the In the present invention, the speech spectrum is analyzed by a large number of bandpass filters, the smallest bandwidth of which is greater than that highest fundamental frequency,

Docket 6667 0 09810/0972 ■*Docket 6667 0 09810/0972 ■ *

6AD6AD

Neue Unt©rfageri («tt-? 11 Äh& a Nr. l Satz 3 dee Xndefungsgs3. v. 4.9.1967)New Unt

de3 Sprachspektrums; durch jeden Bandpaß gehen wenigstens zwei Harmonische- Infolgedessen wird der gesamte harmoniachs Energieanteil des Sprachepektrums mit höherer Genauigkeit und Verläßlichkeit erfaßt. Andererseits sind Rauschen und Ilintergrundgerftusche weit weniger wirksam. de3 language spectrum; at least two harmonics pass through each bandpass filter. As a result, the entire harmonic energy component of the speech spectrum is detected with greater accuracy and reliability. On the other hand, noise and background noise are far less effective.

Gegenstand "der Erfindung ist demnach, eine Anordnung zur Bestimmung der stimmhaften Anteile von Sprachlauten mit Aufteilung der Sprachlauts in Frequenzbänder und Gleichrichtung der Frequenzanieile, mit dem Merkmal, daß die gleichgerichteten Frequenzanteile der Sprachlaute über ein Widerstandsnetzwerk in einem Summenverstärker vereint und über einen Bandpaß« einen Gleichrichter und einen Tiefpaß in einen Cleichepannungfipegel Umgeformt werden.Accordingly, the subject matter of the invention is an arrangement for determining the voiced parts of speech sounds with division of speech sounds in frequency bands and rectification of the frequency range, with the Feature that the rectified frequency components of the speech sounds over A resistor network is combined in a summing amplifier and, via a bandpass filter, a rectifier and a low-pass filter are converted into a single voltage level Be reshaped.

Es hat sich als vorteilhaft erwiesen, die Durchlaßbreite der Bandpässe auf den Bereich zwischen 70 und 150 Hz zu legen und dem Tiefpaß eine obere Grenzfrequenz von 15 Hz zu geben.It has been found to be advantageous to increase the bandwidth of the bandpass filters to the range between 70 and 150 Hz and the low-pass one to give an upper limit frequency of 15 Hz.

Um nicht nur den Absolut- sondern auch den Eelativanteil «es stimmhaften Energiegehalts tier Sprachlaute zu bestimmen, wird nach einem weiteren Erfindungsmerkmal außer dem stimmhaften Anteil auch-ce r gesamte Energiegehalt der Sprachlaute gemessen und mittels eines weiteren Summenverstfirkers die Relation beider Energiegehalte bestimmt.In order to determine not only the absolute but also the relative component of the voiced energy content of speech sounds, a further feature of the invention besides the voiced portion also-ce r The total energy content of the speech sounds is measured and the relationship between the two energy contents is determined by means of a further summing amplifier.

Die Bestimmung des gesamten Energiegehalts der Sp-rachlaute erfolgtThe total energy content of the speech sounds is determined

009810/0972 ^009810/0972 ^

fififi?fififi?

Vorteilhaft curoh Summation der .gleichgerichteten Frequensantoile ties ' gesamten Sprachspektrums. Gute "Ergebnisse zeigten sicbywenn die gleichgerichteten Frequenzanteile de«-Sprachspektrums über Tiefpässe in einer Grencfrequenz von 15 Hs dem SummenverstürkGr zugeführt werden.Advantageously, curoh summation of the "rectified frequency source ties" of the entire speech spectrum. Good results were shown when the rectified frequency components of the speech spectrum are fed to the sum amplification group via low-pass filters at a limit frequency of 15 Hs.

Das nnahfolgerttbofirhricbeiie Auüflilirungebeisplei wird riurch Zeichnungen erläutert.The close-up of the flowering of the example is shown by drawings explained.

Fig. 1 iet eine schematioche Blockdarstellung der erfindungsgemüßen Anordnung undFig. 1 is a schematic block diagram of the inventive Arrangement and

Fig. 2 ist eine detailliertere Schaltung < er Anordnung nach Fig, I.Figure 2 is a more detailed circuit he arrangement according to Fig, I.

Dar Blockst haltbil·. der Fig. 1 gibt einen allgemeinen Überblick über de Anordnung zur Entdeckung stimmhafter Laute, Die Sprachlaute wnr en über da« Mikrophon I eingegeben, <iap Schalloncrgie in elektrische Energie umwandelt; fie^e wir< Ober c'en Ve:«taiker la un< die Leitung 2 in iie Filter-Pank 3 eingegeben, die aus einer Mehrzahl einzelner Bandfilter besteht. Die Ausgangsspannung dieser Filter gelangt über die Leitungen S-Ia, 3-2a bis 3-1 Da (nur drei Leitungen gezeigt) su einzelnen Gleichrichtern in einer Gleichrichter-Bank 4. .Über eile Leitungen 5a, 5b bis 5o gelangen diegleichgerichteten Aus gangs signale der Gleichrichter-Bank 4 zum Detektor für Harmonische 9. Über die Leitungen 4-la, 4-2a bis 4-1 bti, c:ie Tiefpaßfilter-Bank 25 und die Leitungen 27a, 27b bits 27oDar Blockst haltbil ·. 1 gives a general overview of the arrangement for the detection of voiced sounds. The speech sounds are input via the microphone I, which converts acoustic energy into electrical energy; We have entered the line 2 into the filter panel 3, which consists of a plurality of individual band filters. The output voltage of this filter arrives over the lines S-Ia, 3-2a to 3-1 Da (only three lines shown) su individual rectifiers in a rectifier bank 4. The rectified output signals arrive via lines 5a, 5b to 5o the rectifier bank 4 to the detector for harmonics 9. Via the lines 4-la, 4-2a to 4-1 bti, c: ie the low-pass filter bank 25 and the lines 27a, 27b bits 27o

009810/09 7 2 ■ _". ^ < 009810/09 7 2 ■ _ ". ^ <

BAD CG67 BAD CG67

gelangen die gleichen gleichgerichteten -Auagangssignale auch zum Detektor für die Gesamtenergia 29, Durch den Detektor für Harmonische 9 wird der harmoniacho Anteil einer Sprachflchwingung zu einem Gleich· strompegel umgeformt, der Über die Leitung 16 zu dem Differenzbestimmer 17 gelangt; dort wird er mit einem ähnlichen Gleichstrompegel von Leitung 32 verglichen, welche ein Maß für die gesamte spektrale Energie darstellt. Die Bestimmung der gesamten spektralen Energie der Sprache geschieht durch den Umformer 29, der die Energie in einen Gleichstrompegel tiberführt. Der Differenzbeßtimmer 17 liefert auf seiner Auagangsleitung 2Od eine Anzeige für das Vorliegen von stimmhafter Energie. Durch noch anzugebende Maßnahmen wirdörreicht, daß der Diffcrcnzbestimmer 17 ein niedrige« Auagangspotentlal liefert, wenn im Sp räch spektrum der Anteil be doutungs voller Harmonischer vorherrschtj wenn das Sprachspektrum im wesentlichen aus Reibelauten und Rauschon mit geringem oder ohne bedeutungnvollem harmonischem Energieanteil besteht, wird ein hoher Auegangepegel erzeugt« Der Anteil bedeutungs« voller harmonischer Energie im Sprachspektrum ist das Ergebnis stimm· hafter Energie in dem Schallereignie. Die »timmhafte Energie ist in solchen Teilen der Sprache enthalten, während deren von den SUmmbün-. t.ern eine< Erregung ties Vokaltrakte β etattfinuet. Solche Sprachteile ßind beeoncera reich an Harmonischen« die ganze Vielfache der Cruncifrequehz sind; diene Crandfrequenz erstreckt eich für männliche Stimmen bei normaler Sprache von 70 bis 150 Hz und das bedeutungsvolle Spektrum davon the same rectified output signals also get to the Total energy detector 29, Through the harmonic detector 9 the harmonic component of a speech oscillation becomes equal current level converted via line 16 to the difference determiner 17 arrives; there it is compared with a similar DC level from line 32, which is a measure of the total spectral Represents energy. The determination of the total spectral energy of the language is done by the converter 29, which converts the energy into a DC level transferred. The difference measuring device 17 delivers his Auagangsleitung 20d an indication of the presence of voiced Energy. Measures still to be specified mean that the difference determiner 17 supplies a low output potential if In the speech spectrum, the proportion of douting full harmonics predominates if the language spectrum consists essentially of fricative and intoxicating sounds with little or no significant harmonic energy exists, a high output level is generated «The proportion meaning« full of harmonic energy in the language spectrum, the result is correct strong energy in the sound event. The “sound energy is in such parts of the language, during which the SUmmbün-. t.ern a <excitation deep vocal tract β etattfinuet. Such parts of speech are beeoncera rich in harmonics «all multiples of the cruncifrequehz are; The Crand frequency for male voices in normal speech extends from 70 to 150 Hz and the meaningful spectrum thereof

6667 , 009810/0972 6667 , 009810/0972

reicht von 300 bis etwas Über 3000 Ha.ranges from 300 to a little over 3000 ha.

In Zusammenhang mit der mehr ins einzelne gehenden Fig. 2 läßt sich .besser-erkennen auf welche Weise dor harmonische Inhalt ala auch cie gesamte Spektral energie irn Spraehspekirum bestimmt wiru. In Fig. 2 gelangen.die Schallwellen Über das Mikrophon 1 in die Anordnung, cle entsprechenden elektrischen Signale v/erden im Verstärker la verstärkt und der Filterbank 8 über die Leitung 2 zugeleitet. Die Filterbank 3 besteht aus fünfzehn einzelnen Filtern, von denen drei, nflmlich 3-1, 8-2 und 3-1 ä, gezeigt sind. Die hier benutzten Filter sind unter der. Bezeichnung Zwillings-T-Filter bekannt; Jodes hat eine Bandbreite von etwa 3G0 Hs und ist auf die gewünschte Mitteifrequfns abgestimmt. Diese Mittelfrequenzan aiud links in dem die Filterbank anzeigenden Block angeschrieben. Das oberste Filter 3-1 z.B. hat eine Mittelfrequenz von 300 Hz und das unterste Filter 3-1D eine solche von 3QQO Ha. Die Filterbank bildet also eine Mehrzahl von Signalkanälen» die durch auf nebeneinande-!-liegende Frequenzen abgestimmte Filter gesteuert werden; Jedes Filter liefert wahrend eines stimmhaften Sprachlautes eine modulierte Schwingung, deren einhüllende die Sprachgrundschwingung enth&lt. Die Modulation rührt von cer Mischung aev Schwingungen her, welche Harmonische zu der Crundfrequenz Bind, Im vorliegenden Beispiel liefern wenigstens awei Harmonische eine modulierte Schwingung. Diese modulierten Ausgangssignale werden ober die Leitungen 3-la, 3-2a bis S-Ua den Vollweg-In connection with the more particular FIG. 2, can .besser-recognize how dor harmonic content ala also cie entire spectral energy irn Spraehspekirum determined Wiru. In Fig. 2, the sound waves get into the arrangement via the microphone 1, the corresponding electrical signals v / earth are amplified in the amplifier la and fed to the filter bank 8 via the line 2. The filter bank 3 consists of fifteen individual filters, three of which, namely 3-1, 8-2 and 3-1 - are shown. The filters used here are under the. Known as twin T-filter; Jodes has a bandwidth of around 3G0 Hs and is matched to the desired mid-range frequency. This center frequency is written on the left in the block indicating the filter bank. The top filter 3-1, for example, has a center frequency of 300 Hz and the bottom filter 3-1D has a center frequency of 3QQO Ha. The filter bank thus forms a plurality of signal channels which are controlled by filters that are matched to adjacent frequencies; During a voiced speech sound, each filter delivers a modulated oscillation, the envelope of which contains the basic speech oscillation. The modulation results from the mixture of aev vibrations, which harmonics with the fundamental frequency bind. In the present example, at least two harmonics produce a modulated vibration. These modulated output signals are transmitted over the lines 3-la, 3-2a to S-Ua the full-wave

009810/0972009810/0972

Gleichrichtern 4-1, 4-2 bis 4-1 ό augeführt. Über die Leitungen 4-la, 4-2a biß 4-15a gelangen die gleichgerichteten Ausgangsfdgnale von (iiesen Gleichrichtern zu der Tiefpaß-Filterbank 25, öle aus fünfzehn einzelnen Tiefpaßfiltern besteht (nur drei, 26-1, 26-2 und 2G-Ia sind gezeigt). Diese Tie fpa (3 filter dienen dazu, aus den Au η gangs Signalen der Gleichrichter sozusagen die Gleichstromkomponente zu extrahieren. Die Tiefpaßfilter lasten Frequenzen unter Xj Hs durch; ihn* Au-.gungseignale gelangen tlber mit Widerstand behaftete Pfade 27a, 27U bis zumjjgemeinsamen Knotenpunkt 28. Von dort führt eine Leitung 28a zu dem oinen Eingang 30a des Gleichötrom-Summcnvevstärkerfj 30, ueswen zweite Eingangeklemme 30b mit Masse verbunden int. Die Ausgangsklemme 30c und die Singangsklemrne 30a dieses Verstärkers felnd übar den Cegenkopplungepfad 31, der ein Potentiometer 32 enthält, miteinander verbunden. Der Summerverstärker mit seinem wioerstandsbehafteten Einganga-Neizwerk gibt bei Speisung mit gleichgerichteten Schwingungen niedriger Frequenz einen Cleiehstromwert ab, der ein Maß für die gesamte spektrale Energie der dem System angebotenen Sprachlaute darstellt. Im DifferenzbeStimmer 17 wird dann dieses die Gesamtenergie . uarstellenc'e Gleichetromsignal mit einem anueren C leicJistromtignal verglichen, das den Energieunteil der Hunnoninchea cor in das Syatem eingegebenen Sprachlaute uarstellt.Rectifiers 4-1, 4-2 to 4-1 ό implemented. The rectified output signals from (these rectifiers to the low-pass filter bank 25, oils consist of fifteen individual low-pass filters (only three, 26-1, 26-2 and 2G-Ia . are shown) These Tie fpa (3 filter are used from the Au signals η passage of the rectifier, so to speak, the DC component to extract the low-pass filter loads frequencies below Xj Hs by;. him * Au .gungseignale reach tlber with resistive paths 27a, 27U to the common node 28. From there, a line 28a leads to the oinen input 30a of the direct current summation amplifier 30, with the second input terminal 30b connected to ground 32. The buzzer amplifier with its resistance-prone input a-Neizwerk gives when fed with rectified oscillations low F requenz from a Cleiehstromwert that represents a measure of the total spectral energy of the speech sounds offered to the system. In the difference determiner 17 this is then the total energy. The equivalence signal that can be represented is compared with an other C leicJistromtignal, which represents the energy disadvantage of the Hunnoninchea cor speech sounds entered in the Syatem.

Die Bestimmung doa Energieanteile der Haimonischon erfolgt tarch uen Detektor für Harmonisehe 9, dem die gleichgerichteten SchwingungenThe determination of the energy components of the Haimonischon is done tarch uen Detector for Harmonisehe 9, to which the rectified vibrations

009810/0972
6667
009810/0972
6667

auf den Leitungen 5-la, 4-2a bis 4-15a zugeführt werden. Die Leitungen * sind über Kondensatoren 6a, 6b bis 6o an die Widerstände 7a, 7b bis 7o angeschlossen. Letztere führen mit ihren zweiten Enden an den Knoten punkt 8 und von dort über Leitung 8a zur Klemme 10b, der einen Eingangsklemme eines Summenverstärkers 10. Die zweite Eingangsklemme 10a dieses Verstärkers liegt an Masse. Über Leitung 11 und das Potentiometers 12a führt von der Ausgangsklemme 10c dieses "Verstärkers ein Gegenkopplungspfad zu seiner Eingangsklemme 10b. Der Verstärkerausgang ist über Leitung 12 an den Bandpass 13 mit dem Durchlassbereich zwischen 70 und 150 Hz angeschlossen; dieser Durchlassbereich entspricht dem Frequenzbereich der Sprachgrundfrequenz.on lines 5-la, 4-2a to 4-15a. The lines * are connected to resistors 7a, 7b to 7o via capacitors 6a, 6b to 6o connected. The latter lead with their second ends to the node 8 and from there via line 8a to terminal 10b, the one input terminal of a summing amplifier 10. The second input terminal 10a this amplifier is grounded. A negative feedback path leads from output terminal 10c of this "amplifier" via line 11 and potentiometer 12a to its input terminal 10b. The amplifier output is via line 12 to the bandpass filter 13 with the pass band between 70 and 150 Hz connected; this pass band corresponds to the frequency range of the basic speech frequency.

Das hinter dem Bandpass 13 am Punkte 13a auftretende Ausgangssignal stellt die verstärkte Grundfrequenz dar; sie wird im angeschlossenen Gleichrichter 14 gleichgerichtet. Über den Punkt 14a gelangt das gleichgerichtete Signal zum Tiefpass 15, der Frequenzen unter 15 Hz passieren lässt. Das Aus gangs signal des Tiefpasses 15 ist ein Gleichstromwert, der den harmonischen Energieanteil des Sprachsignals abbildet. Über Leitung 16 gelangt dieses Gleichstromsignal über den Widerstand 18 zur einen Eingangsklemme 20a des Verstärkers 20, der einen Teil des Differenz-The output signal occurring behind the bandpass filter 13 at point 13a represents the amplified fundamental frequency; it is rectified in the connected rectifier 14. The rectified signal reaches the low-pass filter 15 via point 14a, which allows frequencies below 15 Hz to pass. The output signal from the low-pass filter 15 is a direct current value that maps the harmonic energy component of the speech signal. Via line 16, this direct current signal reaches an input terminal 20a of the amplifier 20 via the resistor 18, which is part of the differential

■ ι■ ι

bestimrrers ' 17 darstellt. Die Eingangsklemme 20a ist ausserdem über Leitung 23 und den Widerstand 24 mit Masse verbunden. Die zweite Eingangsklemme 20b ist über Leitung 21 und das Potentiometer 22 zur Herstellung einer positiven Rückkopplung mit der Ausgangsklemme 20cbestimrrers' 17 represents. The input terminal 20a is also over Line 23 and resistor 24 connected to ground. The second input terminal 20b is via line 21 and the potentiometer 22 for production positive feedback to output terminal 20c

• BAD• BATH

009810/0972009810/0972

Docket 6667Docket 6667

verbunden.tied together.

Die Cleiehspannungswerte, welche ein Maß für den gesamten harmonischen Energieanteil und für den gooumten spektralen Hnergieinhalt darstellen/ werden durch Justierung cies Verntfirkungagrafies tier beiden Summenveratarker 10 und 20 aufeinander abgestimmt, so tlafl für stimmhafte Sprachlaute der Gloichspanmmgspegel bei 16 größer ist als üer Gleichepannungßpegel bei 32; der Differenzbeetlmmer 17 gelangt dann in einen seiner beiden stabilen Zußtände. Beim Auftreten stimmloser Sprachlaute oder wenn kein Eingangssignal vorliegt, ist dann der Gleichspannungspegel bei IC kleiner ale der Gleichspannungepegel bei 32 und der Diiferenzbeetimmer geht in seinen anderen stabilen Zustand über. Die Anzeige für das Vorliegen oder Fehlen stimmhafter Sprachwelle erfolgt durch den Gleichepannungspegel am Auegang des Differenzbeetimmers 17 an der Klemme 20ri.The voltage values, which represent a measure for the total harmonic energy component and for the high spectral energy content, are matched to one another by adjusting the network function graphs between the two summation indicators 10 and 20, so that for voiced speech sounds the Gloichspanmmgspegel at 16 is greater than above the DC voltage level at 32; the difference bed 17 then reaches one of its two stable states. If voiceless speech sounds occur or if there is no input signal, the DC voltage level at IC is then lower than the DC voltage level at 32 and the differential beetimmer changes to its other stable state. The presence or absence of a voiced speech wave is indicated by the equal voltage level at the output of the differential beetimer 17 at the terminal 20ri.

Die Tatsache« daß eine einceutigo Justage für den Verstärkungsfaktor der Verstärker 10 und 30 existiert, so daß die Spannungsptgel bei 16 und 32 entgegengesetzte Werte annehmen, abhängig von stimmhafter oder stimmloser Spx*ache, hoII nachfolgend erläutert werden.The fact «that a one-to-one adjustment for the gain factor the amplifiers 10 and 30 exist so that the voltage levels at 16 and 32 take on opposite values, depending on voiced or unvoiced speech, which will be explained below.

Das Verhältnis der AuHgangeaignale des Filters 13 bei einerseits einem Eingangeeignal an der Filter-Bank 3 mit einem Spektrum mit einer Grundfrequenz von etwa 100 Hz und einor Reihe von ganzzahllgon HaniioniachenThe ratio of the output signals of the filter 13 on the one hand one Suitable for input at filter bank 3 with a spectrum with a fundamental frequency of about 100 Hz and a series of integer Haniioniachen

009810/bHr009810 / bHr

1M24121M2412

Arnplltutio und bei anderoraeita einem fSArnplltutio and at other a fS

signal mit einem gleichmäßigen Jlauachspektrum mit normaler tuuenverteilungundifejjselben^durchschnittlichenLei&tuiig wio beiin ; . Signal^ ist etwa IBf ff% un«i zwar wegender bekanntem- " , in iipi* kotrclißcemsi' und iüchtkoi'reliorcnde-lleoiant toilejoinos : -signal with a uniform Jlauach spectrum with normal tuuen distribution and the same ^ average lei & tuiig wio beiin; . Signal ^ is about IBf ff% un «i because of the well-known-", in iipi * kotrclisscemsi 'and iüchtkoi'reliorcnde-lleoiant toilejoinos: -

Si{jiiala zu der Amplitude cIoh Cecamtt>ignal8,bei« , tragen l-daä eine lineare Kombinivlion-cicrlvompöaenten carstelll); ö&l^,- * i Siir^chsignalen trittidto grdPte Untei'ficheidUHg zwischen- ,-Si {jiiala to the amplitude cIoh Cecamtt> ignal8, «, l-daä contribute a linear combinivlion-cicrlvompöaenten carstelll); ö & l ^, - i ^ Siir chsignalen trittidto grdPte Untei'ficheidUHg inter -

undVßtiminlöijen; Spracbläuten bei oen offenert Volmlenmufc - z'. B^ beiMQf, ndi-aii xladie^e t-aüte in ilenhöheren; E'requenzbereictieäi; de^Speiitttim^menritermönigicho Enfergte^entftjtltenal» iiiö gtefichlosaenen oder Halbvokale» z. B; w, r. anw. Bei einem gagebonsii*CoaamtencrgiQH: spoktmm liefert ein feiner Reibelaut, z.B. f oder sf di3 kteinetei Λ. ; . Ausgangssignal am Tiefpaß 16» wöhrend gewisse slimmhiiftevBeifeela«it(B,fc ZiBv;«»-1 mlttle^ef^ege^auf Leitung If liefern. Die am wenlgatea verlÄÄ^ ä Aussage»,tretenal&öifSif stimmhaftei Beibelaute uuf und die vetiafl«undVschtiminlöijen; Spracbläuten at oen offenert Volmlenmufc - z '. B ^ beiMQf, ndi-aii xladie ^ e t-aüte in ilenhöheren; Sequence areaäi; de ^ Speiitttim ^ menritermönigicho Enfergte ^ entftjtltenal »iiiö gtefichlosaenen or half vowels» z. B; w, r. appl. With a gagebonsii * CoaamtencrgiQH: spoktmm delivers a fine fricative, e.g. f or s f di3 kteinetei Λ. ; . Output signal at low-pass 16 "while certain slimmhiiftevBeifeela" it (B, fc ZiBv; "" deliver 1 mlttle ^ ef ^ ege ^ on line If.

kaniiiii3rvSrfinüüniis»gedaitkfö sobenutzt? ; ? ciaß nur der harmojaisdhe Inhalt Xe ätge«teilt untr auf summiert <■ ν i} «s jstehtxiftnn ein Ausgang2if;ignal bereit, das die_ zusammengöstrtzte Schwingung f-aratellt. Daraus kann dann ein €leichHpannungs^igna,lj gebilciet und geepoichert -werden, i'äs ein ReJbstöncige: harmonischen Anteil im'SprAchispeÜtrum liefert.kaniiiii3r v Srfinüüniis »gedaitkfö used like that? ; ? If only the harmonic content is divided and summed up, there is an output signal ready which f-arates the combined oscillation. From this, a slight tension can be recorded and stored, so that a tone of tone: harmonic component in the language spectrum delivers.

00^810/097 2 t00 ^ 810/097 2 t

Claims (1)

I, Anordnung sur BoßÜrnmimg dor stimmhaften Anteile voa Snfachläutsn mit 'iUifteilv.ii'^- dor SnivicTiHutfi iri Frc itttcrtsfc^iicie-r xm<.X Clfiidiriehtuuii:I, arrangement sur BoßÜrnmimg dor voiced parts voa Snfachläutsn with 'iUifteilv.ii' ^ - dor SnivicTiHutfi iri Frc itttcrtsfc ^ iicie-r xm <.X Clfiidiriehuuii: Frequenzrmteiiü döi .-Sprix-chlautc übor ci-it:V/id^re^n-danotBv.*ork-(:7); In einom SummnnvoiTtfirkcr {10} voralnt undOber -einen Bn einen.Glolchrlcbtor (14> und cin<inTIcfi:aß(l$y lii einen: Clc pogcl umgeformt worden»Frequency rmtiiü döi.-Sprix-chlautc über ci-it: V / id ^ re ^ n-danotBv. * Ork - (: 7); In einom SummnnvoiTtfirkcr {10} voralnt and above a Bn a Glolchrlcbtor (14> and cin <inTIcfi: aß (l $ y lii one: Clc pogcl has been reshaped » JS, Anortlnungnach Ansprwcli I, dadiirch gekettnssichnati■.;.aail^iier paß (13) ciuen1 UiircMiSiilaarcilch Süvi aelian-70 uadlüO (13) elnoiObcre Frecitiesizurcinse von JSHsIJS, arrangement according to claim I, dadiirch kettnssichnati ■.;. Aail ^ iier pass (13) ciuen 1 UiircMiSiilaarcilch Süvi aelian-70 uadlüO (13) elnoiObcre Frecitiesizurcinse by JSHsI 3. Anordaungnach dort Ansprüehny 1 und Zi geltennzotchnat Suinmenverstärker (20), de »Ben beiden Eingingst! Signal© eum Enorgleahteii der stimmhaften kaute bzw» proportional :zugnrg§r* eamten-lSnerglogaliait--der-SpraeW
Ausgang daa VorUßltrJii beidör Eusrciednicile abiiöhKibar
3. Arrangement according to there claims 1 and Zi habennzotchnat Suinmenträger (20), de »Ben both received! Signal © eum Enorgleahteii of the voiced chewed or »proportional: zunrg§r * eamten-lSnerglogaliait - der-SpraeW
Exit daa VorUßltrJii beidör Eusrciednicile abiiöhKibar
Anordnung nach Anspruch 3, dadurch gekennzGlehn&ti daß 4br gesamte Energiegehalt der Sprachlsttite aus den gleiehgörichteten^^oqttiinsan* teflon der Sprachläiitfi gewonnen sylvct indem die FrequeniantellQ ÄborArrangement according to Claim 3, characterized in that 4br entire Energy content of the linguistic list from the equally gorged ^^ oqttiinsan * teflon der Sprachliitfi won sylvct by the FrequeniantellQ Äbor 0IWIJG/Oi0IWIJG / Oi Je einen Tiefpaß (z. B, 2G-1) in einem weiteren Sumtnenveritllrker (30) voreinigt werden.One low-pass filter each (e.g. 2G-1) in a further summed amplifier (30) must be pre-cleaned. 5. Anordnung nach-Anspruch 4, dadurch gekennzeichnet, daß ciie Tiefpftaae (z.B. 26-1) eine obere Froquetizcrrenro von 15 Ks aufweisen.5. Arrangement according to claim 4, characterized in that ciie deep pftaae (eg 26-1) have an upper Froquetizcrrenro of 15 Ks. 009810/0972009810/0972 r.. r .. LeerseiteBlank page
DE19671572452 1966-09-29 1967-09-23 Arrangement for determining the voiced components of speech sounds Pending DE1572452A1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US582912A US3509281A (en) 1966-09-29 1966-09-29 Voicing detection system

Publications (1)

Publication Number Publication Date
DE1572452A1 true DE1572452A1 (en) 1970-03-05

Family

ID=24330949

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19671572452 Pending DE1572452A1 (en) 1966-09-29 1967-09-23 Arrangement for determining the voiced components of speech sounds

Country Status (4)

Country Link
US (1) US3509281A (en)
DE (1) DE1572452A1 (en)
FR (1) FR1537253A (en)
GB (1) GB1139017A (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3860759A (en) * 1970-09-23 1975-01-14 California Inst Of Techn Seismic system with data compression
US4866777A (en) * 1984-11-09 1989-09-12 Alcatel Usa Corporation Apparatus for extracting features from a speech signal
JP3321156B2 (en) * 1988-03-11 2002-09-03 ブリテツシユ・テレコミユニケイシヨンズ・パブリツク・リミテツド・カンパニー Voice operation characteristics detection

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2151091A (en) * 1935-10-30 1939-03-21 Bell Telephone Labor Inc Signal transmission
US3129287A (en) * 1961-03-20 1964-04-14 Ibm Specimen identification system
US3247322A (en) * 1962-12-27 1966-04-19 Allentown Res And Dev Company Apparatus for automatic spoken phoneme identification

Also Published As

Publication number Publication date
GB1139017A (en) 1969-01-08
US3509281A (en) 1970-04-28
FR1537253A (en) 1968-07-15

Similar Documents

Publication Publication Date Title
DE69417445T2 (en) METHOD AND SYSTEM FOR DETECTING AND GENERATING TRANSITIONAL CONDITIONS IN SOUND SIGNALS
DE3645118C2 (en)
DE1261169B (en) Hearing aid
DE2020753A1 (en) Device for recognizing given speech sounds
DE2919085A1 (en) PRE-PROCESSING METHOD AND DEVICE FOR A VOICE RECOGNITION DEVICE
DE3510660A1 (en) METHOD AND DEVICE FOR PROCESSING A SIGNAL
DE3802903A1 (en) LANGUAGE TRANSFER DEVICE
DE2622423A1 (en) VOCODER SYSTEM
DE69317802T2 (en) Method and device for sound enhancement using encapsulation of multiband pass filtered signals in comb filters
DE4031638A1 (en) VOICE RECOGNITION DEVICE
CH654456A5 (en) METHOD FOR DETERMINING THE SPEED OF AN ASYNCHRONOUS MOTOR.
DE2701814C3 (en) Electric channel vocoder
DE1572452A1 (en) Arrangement for determining the voiced components of speech sounds
DE2109436A1 (en) Amphitheater for electrical signals
DE2431458C2 (en) Procedure and arrangement for automatic speaker recognition
DE2826818C2 (en) Method and apparatus for generating an artificial average speech signal
DE2904426A1 (en) ANALOG VOICE ENCODER AND DECODER
EP1130577B1 (en) Method for the reconstruction of low speech frequencies from mid-range frequencies
DE3621513C2 (en) Method of transmitting an audio signal
DE2062589A1 (en) Method for determining the fundamental frequency of an at least temporarily periodic signal
DE2334459C3 (en) Differentiation between voiced and unvoiced sounds in speech signal evaluation
DE3115801C2 (en)
Tarnóczy The speech-chorus method
DE3630518C2 (en) Device for loudly identifying a speech pattern
DE2650101C2 (en) Method for speech synthesis according to the formant vocoder principle