DE1572452A1 - Arrangement for determining the voiced components of speech sounds - Google Patents
Arrangement for determining the voiced components of speech soundsInfo
- Publication number
- DE1572452A1 DE1572452A1 DE19671572452 DE1572452A DE1572452A1 DE 1572452 A1 DE1572452 A1 DE 1572452A1 DE 19671572452 DE19671572452 DE 19671572452 DE 1572452 A DE1572452 A DE 1572452A DE 1572452 A1 DE1572452 A1 DE 1572452A1
- Authority
- DE
- Germany
- Prior art keywords
- speech
- energy
- voiced
- arrangement according
- rectified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000004809 Teflon Substances 0.000 claims 1
- 229920006362 Teflon® Polymers 0.000 claims 1
- 230000003595 spectral effect Effects 0.000 abstract description 6
- 238000004458 analytical method Methods 0.000 abstract description 2
- 238000001228 spectrum Methods 0.000 description 12
- 230000010355 oscillation Effects 0.000 description 5
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 231100000567 intoxicating Toxicity 0.000 description 1
- 230000002673 intoxicating effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R23/00—Arrangements for measuring frequencies; Arrangements for analysing frequency spectra
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Physics & Mathematics (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
- Monitoring And Testing Of Exchanges (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
Description
V- Γ T L1THl;1 -.",fci.-,'!!5, Internationale Bärn-Sfatichincn Ceselhcfiaft mhfl V- Γ TL 1 THl; 1 -. ", Fci.-, '!! 5 , Internationale Bärn-Sfatichincn Ceselhcfiaft mhfl
' . - Böblingen den 1. August 1969 '. - Böblingen on August 1st, 1969
bi-spbi-sp
Anmelderin: International Business MachinesApplicant: International Business Machines
Corporation, Armonk, N. Y. LQCorporation, Armonk, N.Y. LQ
Amtliches Aktenzeichen P 15 72 452.4Official file number P 15 72 452.4
Aktenzeichen der Anmelderin: Docket 6667Applicant's file number: Docket 6667
Die Erfindung betrifft die Sprachanalyse und insbesondere eine Anordnung zur Bestimmung der stimmhaften Anteile von Sprachlatiten.The invention relates to speech analysis and, more particularly, to an arrangement to determine the voiced proportions of language latites.
In der Technik der Spracherkennung wurde die Bestimmung der stimmhaften Energie als Hilfsmittel bisher kaum in Erwägung gezogen. Zwei Ansätze in dieser Richtung sind bekannt; der eine zieht lediglich das untere Ende des Frequenzbandes zur Energiebestimmung heran, der andere macht von einem einzigen breiten Bandfilter Gebrauch, das das gesamte Frequenzband der Sprache überdeckt. Beim ersten bleibt ein grosser Teil des harmonischen Energieanteils verborgen und der andere ist wegen der grossen .Variation der Amplituden der Harmonischen sehr unzuverlässig. Bei der vorliegenden Erfindung wird das Sprachspektrum durch einen Vielzahl von Bandpässen analysiert, deren kleinste Bandbreite grosser ist als die höchste Grundfrequenz ,In the technology of speech recognition, the determination of the voiced So far, energy has hardly been considered as an aid. Two approaches in this direction are known; one just pulls the lower end of the frequency band for energy determination, the other makes of a single wide band filter that covers the entire frequency band of speech. With the first, a large part of the harmonic remains Energy component hidden and the other is very unreliable because of the large .Variation of the amplitudes of the harmonics. In the In the present invention, the speech spectrum is analyzed by a large number of bandpass filters, the smallest bandwidth of which is greater than that highest fundamental frequency,
Docket 6667 0 09810/0972 ■*Docket 6667 0 09810/0972 ■ *
6AD6AD
Neue Unt©rfageri («tt-? 11 Äh& a Nr. l Satz 3 dee Xndefungsgs3. v. 4.9.1967)New Unt
de3 Sprachspektrums; durch jeden Bandpaß gehen wenigstens zwei Harmonische- Infolgedessen wird der gesamte harmoniachs Energieanteil des Sprachepektrums mit höherer Genauigkeit und Verläßlichkeit erfaßt. Andererseits sind Rauschen und Ilintergrundgerftusche weit weniger wirksam. de3 language spectrum; at least two harmonics pass through each bandpass filter. As a result, the entire harmonic energy component of the speech spectrum is detected with greater accuracy and reliability. On the other hand, noise and background noise are far less effective.
Gegenstand "der Erfindung ist demnach, eine Anordnung zur Bestimmung der stimmhaften Anteile von Sprachlauten mit Aufteilung der Sprachlauts in Frequenzbänder und Gleichrichtung der Frequenzanieile, mit dem Merkmal, daß die gleichgerichteten Frequenzanteile der Sprachlaute über ein Widerstandsnetzwerk in einem Summenverstärker vereint und über einen Bandpaß« einen Gleichrichter und einen Tiefpaß in einen Cleichepannungfipegel Umgeformt werden.Accordingly, the subject matter of the invention is an arrangement for determining the voiced parts of speech sounds with division of speech sounds in frequency bands and rectification of the frequency range, with the Feature that the rectified frequency components of the speech sounds over A resistor network is combined in a summing amplifier and, via a bandpass filter, a rectifier and a low-pass filter are converted into a single voltage level Be reshaped.
Es hat sich als vorteilhaft erwiesen, die Durchlaßbreite der Bandpässe auf den Bereich zwischen 70 und 150 Hz zu legen und dem Tiefpaß eine obere Grenzfrequenz von 15 Hz zu geben.It has been found to be advantageous to increase the bandwidth of the bandpass filters to the range between 70 and 150 Hz and the low-pass one to give an upper limit frequency of 15 Hz.
Um nicht nur den Absolut- sondern auch den Eelativanteil «es stimmhaften Energiegehalts tier Sprachlaute zu bestimmen, wird nach einem weiteren Erfindungsmerkmal außer dem stimmhaften Anteil auch-ce r gesamte Energiegehalt der Sprachlaute gemessen und mittels eines weiteren Summenverstfirkers die Relation beider Energiegehalte bestimmt.In order to determine not only the absolute but also the relative component of the voiced energy content of speech sounds, a further feature of the invention besides the voiced portion also-ce r The total energy content of the speech sounds is measured and the relationship between the two energy contents is determined by means of a further summing amplifier.
Die Bestimmung des gesamten Energiegehalts der Sp-rachlaute erfolgtThe total energy content of the speech sounds is determined
009810/0972 ^009810/0972 ^
fififi?fififi?
Vorteilhaft curoh Summation der .gleichgerichteten Frequensantoile ties ' gesamten Sprachspektrums. Gute "Ergebnisse zeigten sicbywenn die gleichgerichteten Frequenzanteile de«-Sprachspektrums über Tiefpässe in einer Grencfrequenz von 15 Hs dem SummenverstürkGr zugeführt werden.Advantageously, curoh summation of the "rectified frequency source ties" of the entire speech spectrum. Good results were shown when the rectified frequency components of the speech spectrum are fed to the sum amplification group via low-pass filters at a limit frequency of 15 Hs.
Das nnahfolgerttbofirhricbeiie Auüflilirungebeisplei wird riurch Zeichnungen erläutert.The close-up of the flowering of the example is shown by drawings explained.
Fig. 1 iet eine schematioche Blockdarstellung der erfindungsgemüßen Anordnung undFig. 1 is a schematic block diagram of the inventive Arrangement and
Fig. 2 ist eine detailliertere Schaltung < er Anordnung nach Fig, I.Figure 2 is a more detailed circuit he arrangement according to Fig, I.
Dar Blockst haltbil·. der Fig. 1 gibt einen allgemeinen Überblick über de Anordnung zur Entdeckung stimmhafter Laute, Die Sprachlaute wnr en über da« Mikrophon I eingegeben, <iap Schalloncrgie in elektrische Energie umwandelt; fie^e wir< Ober c'en Ve:«taiker la un< die Leitung 2 in iie Filter-Pank 3 eingegeben, die aus einer Mehrzahl einzelner Bandfilter besteht. Die Ausgangsspannung dieser Filter gelangt über die Leitungen S-Ia, 3-2a bis 3-1 Da (nur drei Leitungen gezeigt) su einzelnen Gleichrichtern in einer Gleichrichter-Bank 4. .Über eile Leitungen 5a, 5b bis 5o gelangen diegleichgerichteten Aus gangs signale der Gleichrichter-Bank 4 zum Detektor für Harmonische 9. Über die Leitungen 4-la, 4-2a bis 4-1 bti, c:ie Tiefpaßfilter-Bank 25 und die Leitungen 27a, 27b bits 27oDar Blockst haltbil ·. 1 gives a general overview of the arrangement for the detection of voiced sounds. The speech sounds are input via the microphone I, which converts acoustic energy into electrical energy; We have entered the line 2 into the filter panel 3, which consists of a plurality of individual band filters. The output voltage of this filter arrives over the lines S-Ia, 3-2a to 3-1 Da (only three lines shown) su individual rectifiers in a rectifier bank 4. The rectified output signals arrive via lines 5a, 5b to 5o the rectifier bank 4 to the detector for harmonics 9. Via the lines 4-la, 4-2a to 4-1 bti, c: ie the low-pass filter bank 25 and the lines 27a, 27b bits 27o
009810/09 7 2 ■ _". ^ < 009810/09 7 2 ■ _ ". ^ <
BAD CG67 BAD CG67
gelangen die gleichen gleichgerichteten -Auagangssignale auch zum Detektor für die Gesamtenergia 29, Durch den Detektor für Harmonische 9 wird der harmoniacho Anteil einer Sprachflchwingung zu einem Gleich· strompegel umgeformt, der Über die Leitung 16 zu dem Differenzbestimmer 17 gelangt; dort wird er mit einem ähnlichen Gleichstrompegel von Leitung 32 verglichen, welche ein Maß für die gesamte spektrale Energie darstellt. Die Bestimmung der gesamten spektralen Energie der Sprache geschieht durch den Umformer 29, der die Energie in einen Gleichstrompegel tiberführt. Der Differenzbeßtimmer 17 liefert auf seiner Auagangsleitung 2Od eine Anzeige für das Vorliegen von stimmhafter Energie. Durch noch anzugebende Maßnahmen wirdörreicht, daß der Diffcrcnzbestimmer 17 ein niedrige« Auagangspotentlal liefert, wenn im Sp räch spektrum der Anteil be doutungs voller Harmonischer vorherrschtj wenn das Sprachspektrum im wesentlichen aus Reibelauten und Rauschon mit geringem oder ohne bedeutungnvollem harmonischem Energieanteil besteht, wird ein hoher Auegangepegel erzeugt« Der Anteil bedeutungs« voller harmonischer Energie im Sprachspektrum ist das Ergebnis stimm· hafter Energie in dem Schallereignie. Die »timmhafte Energie ist in solchen Teilen der Sprache enthalten, während deren von den SUmmbün-. t.ern eine< Erregung ties Vokaltrakte β etattfinuet. Solche Sprachteile ßind beeoncera reich an Harmonischen« die ganze Vielfache der Cruncifrequehz sind; diene Crandfrequenz erstreckt eich für männliche Stimmen bei normaler Sprache von 70 bis 150 Hz und das bedeutungsvolle Spektrum davon the same rectified output signals also get to the Total energy detector 29, Through the harmonic detector 9 the harmonic component of a speech oscillation becomes equal current level converted via line 16 to the difference determiner 17 arrives; there it is compared with a similar DC level from line 32, which is a measure of the total spectral Represents energy. The determination of the total spectral energy of the language is done by the converter 29, which converts the energy into a DC level transferred. The difference measuring device 17 delivers his Auagangsleitung 20d an indication of the presence of voiced Energy. Measures still to be specified mean that the difference determiner 17 supplies a low output potential if In the speech spectrum, the proportion of douting full harmonics predominates if the language spectrum consists essentially of fricative and intoxicating sounds with little or no significant harmonic energy exists, a high output level is generated «The proportion meaning« full of harmonic energy in the language spectrum, the result is correct strong energy in the sound event. The “sound energy is in such parts of the language, during which the SUmmbün-. t.ern a <excitation deep vocal tract β etattfinuet. Such parts of speech are beeoncera rich in harmonics «all multiples of the cruncifrequehz are; The Crand frequency for male voices in normal speech extends from 70 to 150 Hz and the meaningful spectrum thereof
6667 , 009810/0972 6667 , 009810/0972
reicht von 300 bis etwas Über 3000 Ha.ranges from 300 to a little over 3000 ha.
In Zusammenhang mit der mehr ins einzelne gehenden Fig. 2 läßt sich .besser-erkennen auf welche Weise dor harmonische Inhalt ala auch cie gesamte Spektral energie irn Spraehspekirum bestimmt wiru. In Fig. 2 gelangen.die Schallwellen Über das Mikrophon 1 in die Anordnung, cle entsprechenden elektrischen Signale v/erden im Verstärker la verstärkt und der Filterbank 8 über die Leitung 2 zugeleitet. Die Filterbank 3 besteht aus fünfzehn einzelnen Filtern, von denen drei, nflmlich 3-1, 8-2 und 3-1 ä, gezeigt sind. Die hier benutzten Filter sind unter der. Bezeichnung Zwillings-T-Filter bekannt; Jodes hat eine Bandbreite von etwa 3G0 Hs und ist auf die gewünschte Mitteifrequfns abgestimmt. Diese Mittelfrequenzan aiud links in dem die Filterbank anzeigenden Block angeschrieben. Das oberste Filter 3-1 z.B. hat eine Mittelfrequenz von 300 Hz und das unterste Filter 3-1D eine solche von 3QQO Ha. Die Filterbank bildet also eine Mehrzahl von Signalkanälen» die durch auf nebeneinande-!-liegende Frequenzen abgestimmte Filter gesteuert werden; Jedes Filter liefert wahrend eines stimmhaften Sprachlautes eine modulierte Schwingung, deren einhüllende die Sprachgrundschwingung enth<. Die Modulation rührt von cer Mischung aev Schwingungen her, welche Harmonische zu der Crundfrequenz Bind, Im vorliegenden Beispiel liefern wenigstens awei Harmonische eine modulierte Schwingung. Diese modulierten Ausgangssignale werden ober die Leitungen 3-la, 3-2a bis S-Ua den Vollweg-In connection with the more particular FIG. 2, can .besser-recognize how dor harmonic content ala also cie entire spectral energy irn Spraehspekirum determined Wiru. In Fig. 2, the sound waves get into the arrangement via the microphone 1, the corresponding electrical signals v / earth are amplified in the amplifier la and fed to the filter bank 8 via the line 2. The filter bank 3 consists of fifteen individual filters, three of which, namely 3-1, 8-2 and 3-1 - are shown. The filters used here are under the. Known as twin T-filter; Jodes has a bandwidth of around 3G0 Hs and is matched to the desired mid-range frequency. This center frequency is written on the left in the block indicating the filter bank. The top filter 3-1, for example, has a center frequency of 300 Hz and the bottom filter 3-1D has a center frequency of 3QQO Ha. The filter bank thus forms a plurality of signal channels which are controlled by filters that are matched to adjacent frequencies; During a voiced speech sound, each filter delivers a modulated oscillation, the envelope of which contains the basic speech oscillation. The modulation results from the mixture of aev vibrations, which harmonics with the fundamental frequency bind. In the present example, at least two harmonics produce a modulated vibration. These modulated output signals are transmitted over the lines 3-la, 3-2a to S-Ua the full-wave
009810/0972009810/0972
Gleichrichtern 4-1, 4-2 bis 4-1 ό augeführt. Über die Leitungen 4-la, 4-2a biß 4-15a gelangen die gleichgerichteten Ausgangsfdgnale von (iiesen Gleichrichtern zu der Tiefpaß-Filterbank 25, öle aus fünfzehn einzelnen Tiefpaßfiltern besteht (nur drei, 26-1, 26-2 und 2G-Ia sind gezeigt). Diese Tie fpa (3 filter dienen dazu, aus den Au η gangs Signalen der Gleichrichter sozusagen die Gleichstromkomponente zu extrahieren. Die Tiefpaßfilter lasten Frequenzen unter Xj Hs durch; ihn* Au-.gungseignale gelangen tlber mit Widerstand behaftete Pfade 27a, 27U bis zumjjgemeinsamen Knotenpunkt 28. Von dort führt eine Leitung 28a zu dem oinen Eingang 30a des Gleichötrom-Summcnvevstärkerfj 30, ueswen zweite Eingangeklemme 30b mit Masse verbunden int. Die Ausgangsklemme 30c und die Singangsklemrne 30a dieses Verstärkers felnd übar den Cegenkopplungepfad 31, der ein Potentiometer 32 enthält, miteinander verbunden. Der Summerverstärker mit seinem wioerstandsbehafteten Einganga-Neizwerk gibt bei Speisung mit gleichgerichteten Schwingungen niedriger Frequenz einen Cleiehstromwert ab, der ein Maß für die gesamte spektrale Energie der dem System angebotenen Sprachlaute darstellt. Im DifferenzbeStimmer 17 wird dann dieses die Gesamtenergie . uarstellenc'e Gleichetromsignal mit einem anueren C leicJistromtignal verglichen, das den Energieunteil der Hunnoninchea cor in das Syatem eingegebenen Sprachlaute uarstellt.Rectifiers 4-1, 4-2 to 4-1 ό implemented. The rectified output signals from (these rectifiers to the low-pass filter bank 25, oils consist of fifteen individual low-pass filters (only three, 26-1, 26-2 and 2G-Ia . are shown) These Tie fpa (3 filter are used from the Au signals η passage of the rectifier, so to speak, the DC component to extract the low-pass filter loads frequencies below Xj Hs by;. him * Au .gungseignale reach tlber with resistive paths 27a, 27U to the common node 28. From there, a line 28a leads to the oinen input 30a of the direct current summation amplifier 30, with the second input terminal 30b connected to ground 32. The buzzer amplifier with its resistance-prone input a-Neizwerk gives when fed with rectified oscillations low F requenz from a Cleiehstromwert that represents a measure of the total spectral energy of the speech sounds offered to the system. In the difference determiner 17 this is then the total energy. The equivalence signal that can be represented is compared with an other C leicJistromtignal, which represents the energy disadvantage of the Hunnoninchea cor speech sounds entered in the Syatem.
Die Bestimmung doa Energieanteile der Haimonischon erfolgt tarch uen Detektor für Harmonisehe 9, dem die gleichgerichteten SchwingungenThe determination of the energy components of the Haimonischon is done tarch uen Detector for Harmonisehe 9, to which the rectified vibrations
009810/0972
6667009810/0972
6667
auf den Leitungen 5-la, 4-2a bis 4-15a zugeführt werden. Die Leitungen * sind über Kondensatoren 6a, 6b bis 6o an die Widerstände 7a, 7b bis 7o angeschlossen. Letztere führen mit ihren zweiten Enden an den Knoten punkt 8 und von dort über Leitung 8a zur Klemme 10b, der einen Eingangsklemme eines Summenverstärkers 10. Die zweite Eingangsklemme 10a dieses Verstärkers liegt an Masse. Über Leitung 11 und das Potentiometers 12a führt von der Ausgangsklemme 10c dieses "Verstärkers ein Gegenkopplungspfad zu seiner Eingangsklemme 10b. Der Verstärkerausgang ist über Leitung 12 an den Bandpass 13 mit dem Durchlassbereich zwischen 70 und 150 Hz angeschlossen; dieser Durchlassbereich entspricht dem Frequenzbereich der Sprachgrundfrequenz.on lines 5-la, 4-2a to 4-15a. The lines * are connected to resistors 7a, 7b to 7o via capacitors 6a, 6b to 6o connected. The latter lead with their second ends to the node 8 and from there via line 8a to terminal 10b, the one input terminal of a summing amplifier 10. The second input terminal 10a this amplifier is grounded. A negative feedback path leads from output terminal 10c of this "amplifier" via line 11 and potentiometer 12a to its input terminal 10b. The amplifier output is via line 12 to the bandpass filter 13 with the pass band between 70 and 150 Hz connected; this pass band corresponds to the frequency range of the basic speech frequency.
Das hinter dem Bandpass 13 am Punkte 13a auftretende Ausgangssignal stellt die verstärkte Grundfrequenz dar; sie wird im angeschlossenen Gleichrichter 14 gleichgerichtet. Über den Punkt 14a gelangt das gleichgerichtete Signal zum Tiefpass 15, der Frequenzen unter 15 Hz passieren lässt. Das Aus gangs signal des Tiefpasses 15 ist ein Gleichstromwert, der den harmonischen Energieanteil des Sprachsignals abbildet. Über Leitung 16 gelangt dieses Gleichstromsignal über den Widerstand 18 zur einen Eingangsklemme 20a des Verstärkers 20, der einen Teil des Differenz-The output signal occurring behind the bandpass filter 13 at point 13a represents the amplified fundamental frequency; it is rectified in the connected rectifier 14. The rectified signal reaches the low-pass filter 15 via point 14a, which allows frequencies below 15 Hz to pass. The output signal from the low-pass filter 15 is a direct current value that maps the harmonic energy component of the speech signal. Via line 16, this direct current signal reaches an input terminal 20a of the amplifier 20 via the resistor 18, which is part of the differential
■ ι■ ι
bestimrrers ' 17 darstellt. Die Eingangsklemme 20a ist ausserdem über Leitung 23 und den Widerstand 24 mit Masse verbunden. Die zweite Eingangsklemme 20b ist über Leitung 21 und das Potentiometer 22 zur Herstellung einer positiven Rückkopplung mit der Ausgangsklemme 20cbestimrrers' 17 represents. The input terminal 20a is also over Line 23 and resistor 24 connected to ground. The second input terminal 20b is via line 21 and the potentiometer 22 for production positive feedback to output terminal 20c
• BAD• BATH
009810/0972009810/0972
Docket 6667Docket 6667
verbunden.tied together.
Die Cleiehspannungswerte, welche ein Maß für den gesamten harmonischen Energieanteil und für den gooumten spektralen Hnergieinhalt darstellen/ werden durch Justierung cies Verntfirkungagrafies tier beiden Summenveratarker 10 und 20 aufeinander abgestimmt, so tlafl für stimmhafte Sprachlaute der Gloichspanmmgspegel bei 16 größer ist als üer Gleichepannungßpegel bei 32; der Differenzbeetlmmer 17 gelangt dann in einen seiner beiden stabilen Zußtände. Beim Auftreten stimmloser Sprachlaute oder wenn kein Eingangssignal vorliegt, ist dann der Gleichspannungspegel bei IC kleiner ale der Gleichspannungepegel bei 32 und der Diiferenzbeetimmer geht in seinen anderen stabilen Zustand über. Die Anzeige für das Vorliegen oder Fehlen stimmhafter Sprachwelle erfolgt durch den Gleichepannungspegel am Auegang des Differenzbeetimmers 17 an der Klemme 20ri.The voltage values, which represent a measure for the total harmonic energy component and for the high spectral energy content, are matched to one another by adjusting the network function graphs between the two summation indicators 10 and 20, so that for voiced speech sounds the Gloichspanmmgspegel at 16 is greater than above the DC voltage level at 32; the difference bed 17 then reaches one of its two stable states. If voiceless speech sounds occur or if there is no input signal, the DC voltage level at IC is then lower than the DC voltage level at 32 and the differential beetimmer changes to its other stable state. The presence or absence of a voiced speech wave is indicated by the equal voltage level at the output of the differential beetimer 17 at the terminal 20ri.
Die Tatsache« daß eine einceutigo Justage für den Verstärkungsfaktor der Verstärker 10 und 30 existiert, so daß die Spannungsptgel bei 16 und 32 entgegengesetzte Werte annehmen, abhängig von stimmhafter oder stimmloser Spx*ache, hoII nachfolgend erläutert werden.The fact «that a one-to-one adjustment for the gain factor the amplifiers 10 and 30 exist so that the voltage levels at 16 and 32 take on opposite values, depending on voiced or unvoiced speech, which will be explained below.
Das Verhältnis der AuHgangeaignale des Filters 13 bei einerseits einem Eingangeeignal an der Filter-Bank 3 mit einem Spektrum mit einer Grundfrequenz von etwa 100 Hz und einor Reihe von ganzzahllgon HaniioniachenThe ratio of the output signals of the filter 13 on the one hand one Suitable for input at filter bank 3 with a spectrum with a fundamental frequency of about 100 Hz and a series of integer Haniioniachen
009810/bHr009810 / bHr
1M24121M2412
Arnplltutio und bei anderoraeita einem fSArnplltutio and at other a fS
signal mit einem gleichmäßigen Jlauachspektrum mit normaler tuuenverteilungundifejjselben^durchschnittlichenLei&tuiig wio beiin ; . Signal^ ist etwa IBf ff% un«i zwar wegender bekanntem- " , in iipi* kotrclißcemsi' und iüchtkoi'reliorcnde-lleoiant toilejoinos : -signal with a uniform Jlauach spectrum with normal tuuen distribution and the same ^ average lei & tuiig wio beiin; . Signal ^ is about IBf ff% un «i because of the well-known-", in iipi * kotrclisscemsi 'and iüchtkoi'reliorcnde-lleoiant toilejoinos: -
Si{jiiala zu der Amplitude cIoh Cecamtt>ignal8,bei« , tragen l-daä eine lineare Kombinivlion-cicrlvompöaenten carstelll); ö&l^,- * i Siir^chsignalen trittidto grdPte Untei'ficheidUHg zwischen- ,-Si {jiiala to the amplitude cIoh Cecamtt> ignal8, «, l-daä contribute a linear combinivlion-cicrlvompöaenten carstelll); ö & l ^, - i ^ Siir chsignalen trittidto grdPte Untei'ficheidUHg inter -
undVßtiminlöijen; Spracbläuten bei oen offenert Volmlenmufc - z'. B^ beiMQf, ndi-aii xladie^e t-aüte in ilenhöheren; E'requenzbereictieäi; de^Speiitttim^menritermönigicho Enfergte^entftjtltenal» iiiö gtefichlosaenen oder Halbvokale» z. B; w, r. anw. Bei einem gagebonsii*CoaamtencrgiQH: spoktmm liefert ein feiner Reibelaut, z.B. f oder sf di3 kteinetei Λ. ; . Ausgangssignal am Tiefpaß 16» wöhrend gewisse slimmhiiftevBeifeela«it(B,fc ZiBv;«»-1 mlttle^ef^ege^auf Leitung If liefern. Die am wenlgatea verlÄÄ^ ä Aussage»,tretenal&öifSif stimmhaftei Beibelaute uuf und die vetiafl«undVschtiminlöijen; Spracbläuten at oen offenert Volmlenmufc - z '. B ^ beiMQf, ndi-aii xladie ^ e t-aüte in ilenhöheren; Sequence areaäi; de ^ Speiitttim ^ menritermönigicho Enfergte ^ entftjtltenal »iiiö gtefichlosaenen or half vowels» z. B; w, r. appl. With a gagebonsii * CoaamtencrgiQH: spoktmm delivers a fine fricative, e.g. f or s f di3 kteinetei Λ. ; . Output signal at low-pass 16 "while certain slimmhiiftevBeifeela" it (B, fc ZiBv; "" deliver 1 mlttle ^ ef ^ ege ^ on line If.
kaniiiii3rvSrfinüüniis»gedaitkfö sobenutzt? ; ? ciaß nur der harmojaisdhe Inhalt Xe ätge«teilt untr auf summiert <■ ν i} «s jstehtxiftnn ein Ausgang2if;ignal bereit, das die_ zusammengöstrtzte Schwingung f-aratellt. Daraus kann dann ein €leichHpannungs^igna,lj gebilciet und geepoichert -werden, i'äs ein ReJbstöncige: harmonischen Anteil im'SprAchispeÜtrum liefert.kaniiiii3r v Srfinüüniis »gedaitkfö used like that? ; ? If only the harmonic content is divided and summed up, there is an output signal ready which f-arates the combined oscillation. From this, a slight tension can be recorded and stored, so that a tone of tone: harmonic component in the language spectrum delivers.
00^810/097 2 t00 ^ 810/097 2 t
Claims (1)
Ausgang daa VorUßltrJii beidör Eusrciednicile abiiöhKibar3. Arrangement according to there claims 1 and Zi habennzotchnat Suinmenträger (20), de »Ben both received! Signal © eum Enorgleahteii of the voiced chewed or »proportional: zunrg§r * eamten-lSnerglogaliait - der-SpraeW
Exit daa VorUßltrJii beidör Eusrciednicile abiiöhKibar
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US582912A US3509281A (en) | 1966-09-29 | 1966-09-29 | Voicing detection system |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE1572452A1 true DE1572452A1 (en) | 1970-03-05 |
Family
ID=24330949
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE19671572452 Pending DE1572452A1 (en) | 1966-09-29 | 1967-09-23 | Arrangement for determining the voiced components of speech sounds |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US3509281A (en) |
| DE (1) | DE1572452A1 (en) |
| FR (1) | FR1537253A (en) |
| GB (1) | GB1139017A (en) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3860759A (en) * | 1970-09-23 | 1975-01-14 | California Inst Of Techn | Seismic system with data compression |
| US4866777A (en) * | 1984-11-09 | 1989-09-12 | Alcatel Usa Corporation | Apparatus for extracting features from a speech signal |
| JP3321156B2 (en) * | 1988-03-11 | 2002-09-03 | ブリテツシユ・テレコミユニケイシヨンズ・パブリツク・リミテツド・カンパニー | Voice operation characteristics detection |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US2151091A (en) * | 1935-10-30 | 1939-03-21 | Bell Telephone Labor Inc | Signal transmission |
| US3129287A (en) * | 1961-03-20 | 1964-04-14 | Ibm | Specimen identification system |
| US3247322A (en) * | 1962-12-27 | 1966-04-19 | Allentown Res And Dev Company | Apparatus for automatic spoken phoneme identification |
-
1966
- 1966-09-29 US US582912A patent/US3509281A/en not_active Expired - Lifetime
-
1967
- 1967-08-17 FR FR8659A patent/FR1537253A/en not_active Expired
- 1967-09-15 GB GB42164/67A patent/GB1139017A/en not_active Expired
- 1967-09-23 DE DE19671572452 patent/DE1572452A1/en active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| GB1139017A (en) | 1969-01-08 |
| US3509281A (en) | 1970-04-28 |
| FR1537253A (en) | 1968-07-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69417445T2 (en) | METHOD AND SYSTEM FOR DETECTING AND GENERATING TRANSITIONAL CONDITIONS IN SOUND SIGNALS | |
| DE3645118C2 (en) | ||
| DE1261169B (en) | Hearing aid | |
| DE2020753A1 (en) | Device for recognizing given speech sounds | |
| DE2919085A1 (en) | PRE-PROCESSING METHOD AND DEVICE FOR A VOICE RECOGNITION DEVICE | |
| DE3510660A1 (en) | METHOD AND DEVICE FOR PROCESSING A SIGNAL | |
| DE3802903A1 (en) | LANGUAGE TRANSFER DEVICE | |
| DE2622423A1 (en) | VOCODER SYSTEM | |
| DE69317802T2 (en) | Method and device for sound enhancement using encapsulation of multiband pass filtered signals in comb filters | |
| DE4031638A1 (en) | VOICE RECOGNITION DEVICE | |
| CH654456A5 (en) | METHOD FOR DETERMINING THE SPEED OF AN ASYNCHRONOUS MOTOR. | |
| DE2701814C3 (en) | Electric channel vocoder | |
| DE1572452A1 (en) | Arrangement for determining the voiced components of speech sounds | |
| DE2109436A1 (en) | Amphitheater for electrical signals | |
| DE2431458C2 (en) | Procedure and arrangement for automatic speaker recognition | |
| DE2826818C2 (en) | Method and apparatus for generating an artificial average speech signal | |
| DE2904426A1 (en) | ANALOG VOICE ENCODER AND DECODER | |
| EP1130577B1 (en) | Method for the reconstruction of low speech frequencies from mid-range frequencies | |
| DE3621513C2 (en) | Method of transmitting an audio signal | |
| DE2062589A1 (en) | Method for determining the fundamental frequency of an at least temporarily periodic signal | |
| DE2334459C3 (en) | Differentiation between voiced and unvoiced sounds in speech signal evaluation | |
| DE3115801C2 (en) | ||
| Tarnóczy | The speech-chorus method | |
| DE3630518C2 (en) | Device for loudly identifying a speech pattern | |
| DE2650101C2 (en) | Method for speech synthesis according to the formant vocoder principle |