[go: up one dir, main page]

DE2214521A1 - Sprachsyntheseschaltung - Google Patents

Sprachsyntheseschaltung

Info

Publication number
DE2214521A1
DE2214521A1 DE19722214521 DE2214521A DE2214521A1 DE 2214521 A1 DE2214521 A1 DE 2214521A1 DE 19722214521 DE19722214521 DE 19722214521 DE 2214521 A DE2214521 A DE 2214521A DE 2214521 A1 DE2214521 A1 DE 2214521A1
Authority
DE
Germany
Prior art keywords
frequency
auxiliary
generators
information
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE19722214521
Other languages
English (en)
Inventor
C Dechaux
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales SA
Original Assignee
Thomson CSF SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson CSF SA filed Critical Thomson CSF SA
Publication of DE2214521A1 publication Critical patent/DE2214521A1/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

THOMSON - CSP
173» Bd. Haussmann
Paris 8e /!Frankreich
Unser Zeichen: T 1160
Sprachsyntheseschaltung
Die Erfindung bezieht sich auf eine Sprachsyntheseschaltung, die eine digitale Information empfängt, welche mit einer Folgeperiode T, die einer Abtastperiode T enspricht, eine Information ausdrückt, die nachfolgend Hauptinformation genannt wird und es ermöglicht, ein Sprachelement annähernd dadurch wieder herzustellen, daß für jede Abtastperiode eine bestimmte Anzahl ρ von Sinussignalen addiert werden, deren Frequenz und Amplitude die Hauptinformation bilden und die hier "Hauptkomponenten" genannt werden, wobei ρ gleich einer festen Zahl η oder kleiner als diese ist. Die zuvor angegebene Hauptinformationsart ist in der PR-PS 2 044 290 angegeben. Kurz gesagt ist eine Hauptkomponente ein zeitlicher Abschnitt eines Formanten, wobei ein Formant als eine zeitliche Folge von · Spektralkomponenten gleicher oder benachbarter Frequenzen
Lei/Gl
209 8 41 /081 2
_2_ ' 22H521
definiert ist, der einem (absoluten oder relativen) Energiemaximum in dem Sprachspektrum entspricht. Die Formantenabschnitte, die für jede Abtastung der Sprache übertragen v/erden, v/erden aufgrund von Kriterien bestimmt, die in der zuvor angegebenen Patentschrift dargelegt sind. Die Analyse des Schalls erfolgt mit Hilfe einer Filterbatterie, und die Frequenzen der Hauptkomponenten werden nur mit einer gewissen Annäherung übertragen.
Das Ziel der Erfindung ist die Schaffung einer Sprachsyntheseschaltung dieser Art, bei der es durch Verwendung einer Hilfsinformation möglich ist, die sprechende Person in gewissem Maße zu identifizieren.
Diese Hilfsinformation ist die in der angelsächsischen Literatur "pitch information" genannte Information, die hier Stimmhöheninformation genannt wird. Diese Information ist während der Abgabe von Vokalen und stimmhaften Konsonanten ("voiced" in der angelsächsischen Literatur) durch eine Frequenz gebildet, welche die Schwingungsfrequenz der Stimmbänder der sprechenden Person ist und kürzer "Stimmhöhenfrequenz" genannt werden soll; sie liegt im allgemeinen zwischen 80 und 350 Hz, Die sich auf die Vokale und stimmhaften Konsonanten beziehenden Spektralkomponenten sind Harmonische dieser Stimmhöhenfrequenz, was bei den stummen Konsonanten ("unvoiced" in der angelsächsischen Literatur) nicht der Fall ist.
Es sind bereits verschiedene Anordnungen für die sendeseitige Messung der Stimmhöhenfrequenz beschrieben worden. Ein entsprechendes Literaturverzeichnis findet sich in dem Buch "Speech Analysis, Synthesis and Perception" von
209841/0812
J.L. Flanagan, Springer-Verlag, Berlin-Heidelberg-New York, 1965.
Die einfachsten Anordnungen dieser Art arbeiten mit Spitzenwertdetektoren: Das Sprachsignal wird einem Bandfilter oder, der höheren Sicherheit wegen, zwei Bandfiltern zugeführt, wodurch normalerweise ein Signal geliefert wird, das bei der Abgabe von Vokalen oder stimmhaften Konsonanten mit der Stimmhöhenfrequenz amplitudenmoduliert ist. Auf jedes dieser Bandfilter folgt ein Amplitudendetektor, dem wiederum ein Spitzenwertdetektor nachgeschaltet ist, wobei die Frequenz der Spitzenwerte der Stimmhöhenfrequenz entspricht, wenn diese in dem Signal in Erscheinung tritt; andernfalls liefert die Meßanordnung eine sehr stark schwankende Ausgangsfrequenz.
Bei zahlreichen Systemen zur digitalen Sprachübertragung wird die von der Meßanordnung gelieferte Frequenz, die hier Hilfsfrequenz genannt wird, dauernd auf einem Hilfskanal übertragen, unabhängig davon, ob sie mit der Stiramhöhenfrequenz identisch ist oder nicht; man überträgt jedoch außerdem ein Sondersignal, dessen Bildung einen komplizierten Materialaufwand erfordert und das anzeigt, ob die Hilfsfrequenz die Stimmhöhenfrequenz ist. Wenn dies zutrifft, erfolgt die Sprachsynthese mit Hilfe eines Generators, der Harmonische dieser Frequenz erzeugt, die offensichtlich nur bis auf die Quantisierungen genau wiederhergestellt wird; andernfalls v/ird die Hilfsfrequenz nicht verwendet, und die Synthese erfolgt mit Hilfe eines Rauschgenerators.
Bei der in der zuvor erwähnten französischen Patentschrift beschriebenen Sprachsyntheseschaltung, bei der
2098A1/0812
22H521
die Synthese nach einem völlig anderen Prinzip mit Hilfe einer kleinen Anzahl von "Hauptkomponenten" erfolgt, wird die Stimmhöheninformation nicht verwendet.
Die Erfindung ermöglicht die Ausnutzung der Stimmhöheninformation durch gleichzeitige Rückstellungen auf vorbestimmte Phasen für alle Hauptkomponenten, wobei diese Rückstellungen auf vorbestimmte Phasen mit der Stimmhöhenfrequenz erfolgen; dadurch ist es möglich, das Summensignal der Hauptkomponenten mit dieser Frequenz periodisch zu machen.
Nach der Erfindung ist eine Sprachsyntheseschaltung zur synthetischen Spracherzeugung aufgrund einer periodischen Information, die eine Hauptinformation enthält, die sich auf ein Sprachelement bezieht und durch die Frequenzen und Amplituden von ρ sinusförmigen Hauptkomponenten gebildet ist, wobei ρ eine veränderliche Zahl ist, die höchstens gleich einer festen Zahl η >1 ist, mit η frequenzveränderlichen Generatoren und η Amplitudeneinstellanordnungen, die jeweils einem der η Generatoren zugeordnet sind, wobei die η Generatoren und Amplitudeneinstellanordnungen durch die Hauptinformation für die Wiederherstellung der Hauptkomponenten gesteuert werden, und mit einer Addierschaltung, welche die Summe der wiederhergestellten Hauptkomponenten bildet, dadurch gekennzeichnet, daß zur Verwendung einer Hilfsinformation, die durch eine Hilfsfrequenz gebildet ist, die während der Aussendung von Vokalen und stimmhaften Konsonanten die Schwingungsfrequenz der Stimmbänder der sprechenden Person ('Btimmhöhenfrequenz") ist, eine Anordnung zur Rückstellung jeder der wiederhergestellten Hauptkomponenten auf eine vorbestimmte Phase vorgesehen ist, wobei
2098A 1 /0812
die Rückstellungen auf die vorbestimmten Phasen für die Haupt !componenten gleichzeitig stattfinden und von der Hilfsinformation so gesteuert werden, daß sie mit der Hilfsfrequenz wenigstens dann erfolgen, wenn die Hilfsfrequenz die Stimmhöhenfrequenz ist.
Ein Ausführungsbeispiel der Erfindung ist in der Zeichnung dargestellt, deren einzige Figur das Blockschaltbild einer bevorzugten Ausführungsform einer Sprachsyntheseschaltung nach der Erfindung zeigt.
Die Zeichnung zeigt die Informationsquelle 1, die zur Speisung der Sprachsyntheseschaltung bestimmt ist.
Diese Informationsquelle kann beispielsweise die letzte Stufe einer Empfangsanordnung sein, welche die für die Sprachsynthesesehaltung notwendigen Informationen in Form von parallelen Binärsignalen liefert. Jede der aufeinanderfolgenden Informationen wird an den Ausgängen der Informationsquelle 1 für eine Periode T aufrecht erhalten, die der Analyseperiode gleich ist.
Es ist hier angenommen, daß die maximale Anzahl η von Hauptkomponenten 3 beträgt.
Die Informationsquelle 1 hat also sieben Mehrfachausgänge (von denen jeder Draht einer Binärziffer entspricht), nämlich die Ausgänge 11, 12 und 13, welche die Frequenzen F.., Pp bzw. F-Z der Hauptkomponenten liefern, die Ausgänge 21, 22, und 23, welche die entsprechenden Aplituden A^, Ap bzw. A^ liefern, und schließlich den Ausgang 10, der die Hilfsfrequenz f liefert." Wie noch zu sehen sein wird, ist es überflüssig, dem Gerät ein Sondersignal zu liefern, das anzeigt, ob die Hilfsfrequenz während des Empfangs die Stimmböhenfrequenz ist oder nicht.
209841/0812
22U521
Die Ausgänge 11, 12, 13 sind jeweils mit einer von drei Codeumsetzerschaltungen 31» 32 bzw. 33 verbunden, welche den die Frequenzen F1, Fp, F, darstellenden Digitalinformationen (die im allgemeinen durch die Identifizierungsnummer eines Analysefilters gegeben sind) die folgenden Zahlen zuordnen:
F Fr> J?
N1 = ^ N = N =
wobei F eine Frequenz ist, die sehr viel höher als das sendeseitig analysierte Tonfrequenzband (beispielsweise bis 3500 Hz) ist, während q eine feste ganze Zahl ist, beispielsweise in der Größenordnung von 10.
Drei mit Zählung arbeitende veränderliche Frequenzteiler 41, 42, 43 empfangen die Impulse eines Taktgebers 2 mit der Frequenz F . Diese Frequenzteiler sind jeweils mit Mehrfach-Steuereingängen versehen, die an die Ausgänge der Codeumsetzerschaltungen 31, 32 bzw. 33 angeschlossen sind, und ihre Ausgänge sind mit den Frequenzsteuereingängen 61, 62 bzw. 63 von drei Signalgeneratoren 51, 52 bzw. 53 verbunden, denen sie Impulse der Frequenz 2qF., 2qFp bzw. 2qF, zuführen.
Jeder dieser drei Generatoren ist in an sich bekannter Weise so ausgeführt, daß er im wesentlichen ein Verschieberegister mit q Stufen enthält, dessen Ausgang mit dem Eingang über einen Negator verbunden ist, der eine Ziffer "1" in eine Ziffer "0" und umgekehrt umformt. Die q Stufen sind jeweils mit Hilfsausgängen versehen, die mit einer Schaltung verbunden sind, die ein von einer Spannungsquelle gespeistes Widerstandsnetzwerk enthält. Das Verschieberegister wird anfänglich in geeigneter Weise gefüllt, beispielsweise mit q Ziffern "O". Der Inhalt
209 8 Λ 1 /081 2
22U521
des Verschieberegisters ändert sich mit jedem Fortschalteimpuls, und die Stellung der Ziffern "1" in dem Verschieberegister bestimmt die Widerstände, die zur Bildung des Ausgangssignals des Generators beitragen. Dieses Ausgangssignal ist also durch eine Treppenspannung gebildet. Das Widerstandsnetzwerk ist so berechnet, daß für jeweils 2q Fortschalteimpulse, die mit einer festen Folgeperiode geliefert werden, die Hüllkurve des Ausgangssignals (bis auf eine Gleich-Stromkomponente) einen Zyklus einer Sinusschwingung darstellt.
Für eine periodische Folge von Fortschalteimpulsen liefert' der Generator ein Treppensignal, das eine be- , stimmte Anzahl von Zyklen enthält, und dieses Treppensignal braucht nur durch ein Tiefpaßfilter geschickt zu werden, damit es in ein sinusförmiges Signal umgeformt wird, während die Gleichstromkomponente normalerweise verloren geht, beispielsweise durch die vorgenommenen Verstärkungen.
Derartige Generatoren sind in dem Aufsatz "Digital Generation of Low-Frequency Sine Waves" von Anthony C. Davies in der Zeitschrift "IEEE Transactions of Instrumentation and Measurement", Band IM 18, Nr. 2, Juni 1969, Seiten 97 bis 105 beschrieben. Solche Generatoren und ganz allgemein alle Sinusgeneratoren, bei denen ein Widerstandsnetzwerk verwendet wird, das durch ein Verschieberegister umgeschaltet wird, werden hier "Verschieberegister-Widerstandsnetzwerk—Generatoren" genannt.
Unter diesen Voraussetzungen sind in dem Schaltbild die Eingänge 61, 62 und 63 der Generatoren 51, 52 bzw. 53 die Eingänge der Fortschalteanordnung der darin enthaltenen Verschieberegister.
2098^1/0812
Es ist leicht zu erkennen, daß unter diesen Bedingungen die drei Generatoren jeweils Ausgangsspannungen liefern, deren Hüllkurven (bis auf eine Gleichstromkomponente) Abschnitte von Sinuskurven mit der Frequenz P., Fp bzw. F, sind.
Es ist auch leicht zu erkennen, daß der Inhalt des Verschieberegisters in einem gegebenen Zeitpunkt die Phase des sinusförmigen Signals in diesem Zeitpunkt bestimmt.
Die drei Generatoren haben ferner Eingänge 71, 72 bzw. 73, welche die Nullrückstellung aller Stufen ihrer Verschieberegister ermöglichen, wobei dieser Zustand des entsprechenden Verschieberegisters der Phase +270° des sinusförmigen Signals entspricht.
Die drei Generatoren speisen jeweils eines von drei veränderlichen Dämpfungsgliedern 81, 82 bzw. 83, deren Steuereingänge mit den Ausgängen 21, 22 bzw. 23 der Informationsquelle 1 über einen von drei Digital-Analog-Umsetzern 91j 92 bzw. 93 verbunden sind.
Hier ist folgendes zu bemerken: Wenn für eine gegebene Abtastperiode ρ kleiner als η oder sogar Null (Schweigeperioden) ist, läßt sich diese Information leicht durch eine Information der Amplitude 0 auf den Kanälen ausdrücken, was dem Nichtvorhandensein von Hauptkomponenten entspricht, so daß es bedeutungslos ist, wie sich die entsprechenden Generatoren in der betreffenden Periode verhalten, da ihre eventuellen Ausgangssignale dann durch die einstellbaren Dämpfungsglieder gesperrt werden.
Die Ausgangssignale der Dämpungsglieder 81, 82 und 83
2 0 9 8 Λ 1/0812
werden in einer Addierschaltung 55 addiert. Die am Ausgang der Addierschaltung 55 erscheinenden Signale haben infolge einer Kopplungskapazität, die an einem beliebigen geeigneten Punkt eingefügt ist, ihre Gleichstromkomponenten verloren. Der Ausgang der Addierschaltung 55 speist den Trägerfreqüenzeingang eines Amplitudenmodulators 65» dessen Ausgang mit dem Eingang eines das Ausgangssignal der Sprachsyntheseschaltung darstellenden elektroakustischen Wandlers 85 über ein Tiefpaßfilter 75 verbunden ist.
Die Hilfsfrequenz wird bei dieser bevorzugten Ausführungsform der Sprachsyntheseschaltung nicht nur für die zuvor erwähnten Rückstellungen auf vorbestimrate Phasen verwendet, sondern auch für eine (im Modulator 65 erfol- m gende)Araplitudenmodulation des Ausgangssignals der Addierschaltung 55» und zwar in der Weise, daß der Augenblickswert des Modulationssignals mit der Frequenz f bei den Rückstellungen auf vorbestimrate Phasen durch ein Minimum geht. Der dadurch erhaltene Gesamteffekt ist sehr befriedigend.
Bei dem angegebenen Ausführungsbeispiel wird die Phase jeder Hauptkomponente auf den gleichen festen Wert zurückgestellt, der dem Inhalt 0 in allen Stufen jedes Verschieberegisters entspricht.
Schließlich wird bei diesem Ausführungsbeispiel an den Schaltungen nichts geändert, wenn die Hilfsfrequenz nicht die Höhenfrequenz ist, wodurch das zuvor erwähnte Sondersignal entfällt. Die erratischen Frequenzen, die nacheinander die Hilfsfrequenz bei der Abgabe von stummen Konsonanten bilden, führen zu Phasenrückstellungen und zu einer Amplitudenmodulation, die sich erratisch von
2098A1/0812
22U521 - ίο -
einer Syntheseperiode zur nächsten ändern, und es ist festgestellt worden, daß der dadurch für die Synthese von stummen Konsonanten erhaltene Höreffekt eine bessere Qualität hatte, als sie erhalten wird, wenn die Phasenrückstellungen und die Amplitudenmodulation für die Synthese von stummen Konsonanten unterdrückt werden. Dadurch werden außerdem die Schaltungen vereinfacht.
Somit speist bei der dargestellten Schaltung der Ausgang 10 der Informationsquelle 1 die Erzeugung eines Signals der Frequenz f eine Schaltung von gleicher Art, wie sie hinsichtlich der Frequenz für die treppenförmigen Signale mit den Frequenzen F.., Fp, F., verwendet wird.
Diese Schaltung enthält eine Codeumsetzerschaltung 30, auf die ein einstellbarer Frequenzteiler 40 und ein Generator 50 folgen.
Da jedoch die Frequenz f unter den Frequenzen der Mehrzahl der Hauptkomponenten liegt, erfolgt die 'Zuführung von Impulsen zu dem einstellbaren Frequenzteiler 40 durch einen festen Frequenzteiler 90, der seinerseits von dem Taktgeber 2 gespeist wird.
Das von dem Generator 50 gelieferte Ausgangssignal mit der Frequenz f wird dem Modulationseingang des Modulators 65 zugeführt. Bei diesem Beispiel ist das Modulationssignal das vom Generator 50 gelieferte treppenförraige Signal, das nicht von seiner Gleichstromkomponente befreit ist, so daß es durch ein Minimum des Wertes 0 geht, wenn das Verschieberegister des Generators 50 nicht mit Nullen gefüllt ist; ferner ist die Modulationstiefe so eingestellt, daß das modulierte
209841/0812
Signal gleichzeitig mit dem Modulationssignal zu Null wird. Das Ausgangssignal des Modulators 65 geht dann durch das Tiefpaßfilter 75, welches das Ausgangssignal des Modulators 65 glättet und dadurch die Unstetigkeiten zum Verschwinden bringt, die von den Treppenstufen sowohl des Modulationssignals als auch des modulierten Signals stammen.
Die Nulldurchgänge des Ausgangssignals des Generators werden mit Hilfe einer Decodierschaltung festgestellt, die hier nur aus einem einfachen llWeder~Noch"-Gatter besteht, das zwei Eingänge hat, die mit den beiden äußersten Stufen des Verschieberegisters im Generator 50 verbunden sind. Es läßt sich nämlich leicht nachprüfen, daß dieses Verschieberegister nur dann gleichzeitig eine Null in jeder dieser beiden äußersten Stufen aufweisen kann, wenn alle Stufen im Zustand 0 sind. Das Ausgangssignal des Gatters 35 wird den Eingängen 71, 72 und 73 der Generatoren 51, 52 bzw. 53 zugeführt und bewirkt dadurch die Rückstellungen auf die vorbestimmte Phase in den gewünschten Augenblicken.
Eine Weiterbildung, durch welche die Wiederherstellung der Vokale und der stimmhaften Konsonanten verbessert wird, besteht darin, daß als Modulationssignal ein periodisches Signal der Periode 0=1/f verwendet wird, von dem ein Zyklus durch zwei sinusförmige Halbzyklen (bis auf die Gleichstromkomponenten, welche ihnen den Miniraalwert Null erteilen) mit der Dauer 0/4 für den Anstieg von Null bis zum Maximum und der Dauer 3 0/4 für den Wiederabfall vom Maximum auf Null gebildet ist.
Aufgrund dieser Unsymmetrie kann man dann nicht mehr einen Generator verwenden, dessen Verschieberegister q Stufen enthält, um ein Signal der Frequenz f mit Hilfe
209841 /0812
22H521
von Portschalteimpulsen der Folgefrequenz 2 q f zu erhalten.
Man kann jedoch beispielsweise einen gleichartigen Generator verwenden, dessen Verschieberegister 2 q Stufen enthält und anfänglich mit einer Ziffer "1" und (2q-1) Ziffern »0» gefüllt wird, wobei die Schleife zwischen dem Eingang und dem Ausgang des Verschieberegisters keinen Negator enthält.
Man verwendet dann ein Netzwerk von 2q Widerständen, von denen jeder wahlweise für eine Stelle der Ziffer "1" an die Spannungsquelle angeschlossen wird, wodurch es möglich ist, einem Zyklus des treppenförmigen Signals jede gewünschte Form zu erteilen.
Eine gegebene Phase der Hüllkurve des Ausgangssignals wird dadurch angezeigt, daß in einer gegebenen Stufe die einzige im Verschieberegister umlaufende Ziffer "1" festgestellt wird, und der Ausgang dieser Stufe kann direkt die Rückstellungen auf die vorbestimmte Phase steuern.
Eine andere Lösung besteht darin, daß der Generator von Pig. 1 beibehalten wird, und daß ihm Portschalteimpulse zugeführt werden, deren Frequenz für die ansteigenden Abschnitte des Signals (Übergang des Verschieberegisters vom Zustand "lauter 0" zum Zustand "lauter 1") dreimal größer als für die abfallenden Signalabschnitte (Rückkehr in den Zustand "lauter 0") ist.
2 0 9 8 Λ 1/0812

Claims (3)

  1. Patentansprüche
    1J Sprachsyntheseschaltung zur synthetischen Spracherzeugung auf Grund einer periodischen Information, die eine Hauptinformation enthält, die sich auf ein Sprachelement be-* zieht und durch die Frequenzen und Amplituden von ρ sinusförmigen Hauptlcomponenten gebildet ist, wobei ρ eine veränderliche Zahl ist, die höchstens gleich einer festen Zahl n>1 ist, mit η frequenzveränderlichen Generatoren und η Amplitudeneinstellanordnungen, die jeweils einem der η Generatoren zugeordnet sind, wobei die η Generatoren und Amplitudeneinstellanordnungen durch die Hauptinformation für die Wiederherstellung der Haupt !componenten gesteuert werden, und mit einer Addierschaltung, welche* die Summe der wiederhergestellten Hauptkomponenten bildet, dadurch gekennzeichnet, daß zur Verwendung einer Hilfsinformation, die durch eine Hilfsfrequenz gebildet ist, die während der Aussendung von Vokalen und stimmhaften Konsonanten die Schwingungsfrequenz der Stimmbänder der entsprechenden Person ("Stimmhöhenfrequenz11) ist, eine Anordnung zur Rückstellung jeder der wiederhergestellten Hauptkomponenten auf eine vorbestimmte Phase vorgesehen ist, wobei die Rückstellungen auf die vorbestimmten Phasen für die Hauptkomponenten gleichzeitig stattfinden und von der Hilfsinformation so gesteuert werden, daß sie mit der Hilfsfrequenz wenigstens dann erfolgen, wenn die Hilfsfrequenz die Stimmhöhenfrequenz ist.
  2. 2. Sprachsyntheseschaltung nach Anspruch 1, dadurch gekennzeichnet, daß die Rückstellungen auf vorbestimmte Phasen mit der Hilfsfrequenz unabhängig davon durchgeführt werden, ob diese die Stimmhöhenfrequenz ist oder nicht, daß eine Amplitudenmodulationsanordnung für die
    209841 /0812
    Amplitudenmodulation des Summensignals der Hauptkomponenten durch ein Modulationssignal mit der Hilfsfrequenz vorgesehen ist, und daß die Rückstellungen auf vorbestimmte Phasen dann erfolgen, wenn der Augenblickswert des Modulationssignals durch ein Minimum geht.
  3. 3. Sprachsyntheseschaltung nach Anspruch 2, gekennzeichnet durch einen frequenzveränderlichen Hilfsgenerator, der von der Hilfsinformation so gesteuert wird, daß er ein Signal mit der Hilfsfrequenz liefert, und daß jeder der η Generatoren und der Hilfsgenerator ein Verschieberegister-Widerstandsnetzwerks-Generator ist, wobei das Verschieberegister jedes der η Generatoren einen Phasensteuereingang aufweist, der die Rückstellung des Verschieberegisters in einen vorbestimmten Zustand ermöglicht, daß die Phasenrückstellanordnung durch den Hilfsgenerator und durch eine Decodieranordnung, die dann ein Steuersignal liefert, wenn das Verschieberegister des Hilfsgenerators sich in einem vorbestimmten Zustand befindet, gebildet ist, daß der Ausgang der Decodieranordnung mit den Phasensteuereingängen verbunden ist, und daß die Amplitudenmodulationsanordnung durch den Hilfsgenerator und durch einen Amplitudenmodulator, dessen Trägereingang mit dem Ausgang der Addierschaltung und dessen Modulationseingang mit dem Ausgang des Hilfsgenerators verbunden sind, gebildet ist.
    209841/0812
DE19722214521 1971-03-26 1972-03-24 Sprachsyntheseschaltung Pending DE2214521A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR7110824A FR2130952A5 (de) 1971-03-26 1971-03-26

Publications (1)

Publication Number Publication Date
DE2214521A1 true DE2214521A1 (de) 1972-10-05

Family

ID=9074226

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19722214521 Pending DE2214521A1 (de) 1971-03-26 1972-03-24 Sprachsyntheseschaltung

Country Status (10)

Country Link
US (1) US3830977A (de)
AU (1) AU463038B2 (de)
BE (1) BE781116A (de)
DE (1) DE2214521A1 (de)
FR (1) FR2130952A5 (de)
GB (1) GB1364775A (de)
IT (1) IT952370B (de)
NL (1) NL7203873A (de)
SE (1) SE375178B (de)
ZA (1) ZA721392B (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1541429A (en) * 1975-12-19 1979-02-28 Int Computers Ltd Speech synthesising apparatus
US4051331A (en) * 1976-03-29 1977-09-27 Brigham Young University Speech coding hearing aid system utilizing formant frequency transformation
US4566117A (en) * 1982-10-04 1986-01-21 Motorola, Inc. Speech synthesis system
US5140639A (en) * 1990-08-13 1992-08-18 First Byte Speech generation using variable frequency oscillators
RU2296377C2 (ru) * 2005-06-14 2007-03-27 Михаил Николаевич Гусев Способ анализа и синтеза речи
CN111627451B (zh) * 2013-06-21 2023-11-03 弗朗霍夫应用科学研究促进协会 用于获取音频信号的替换帧的频谱系数的方法及相关产品

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3268660A (en) * 1963-02-12 1966-08-23 Bell Telephone Labor Inc Synthesis of artificial speech
US3394228A (en) * 1965-06-03 1968-07-23 Bell Telephone Labor Inc Apparatus for spectral scaling of speech
US3491205A (en) * 1966-09-29 1970-01-20 Philco Ford Corp Plural formant speech synthesizer
US3499991A (en) * 1967-08-01 1970-03-10 Philco Ford Corp Voice-excited vocoder
GB1225142A (de) * 1967-11-29 1971-03-17

Also Published As

Publication number Publication date
SE375178B (de) 1975-04-07
ZA721392B (en) 1972-11-29
BE781116A (fr) 1972-07-17
US3830977A (en) 1974-08-20
NL7203873A (de) 1972-09-28
FR2130952A5 (de) 1972-11-10
GB1364775A (en) 1974-08-29
AU4037572A (en) 1973-09-27
AU463038B2 (en) 1975-06-26
IT952370B (it) 1973-07-20

Similar Documents

Publication Publication Date Title
DE2162486A1 (de) Digital gesteuerter Impulsgenerator
DE2840596A1 (de) Sprachsynthesizer
DE2530380A1 (de) Sprachsynthetisatorsystem
DE2644478A1 (de) Differential-phasenumtast-modulator
DE2214521A1 (de) Sprachsyntheseschaltung
DE2523625A1 (de) Digitalfilter
DE2850059A1 (de) Digital/analog-wandler
DE2130935A1 (de) Digital-Filtergeraet
DE2435654C2 (de) Verfahren und Vorrichtung zur Analyse und Synthese von menschlicher Sprache
CH647112A5 (de) Schaltungsanordnung zur gewinnung einer zu der impulsdichte einer impulsfolge proportionalen steuerspannung.
DE2051589A1 (de) Anordnung zur Synthese eines Signals
DE1122581B (de) Verfahren und Schaltungsanordnung zur angenaeherten Nachbildung der Kurzzeitspektren von nach dem Vocoderverfahren uebertragenen Sprachsignalen
DE2850240C2 (de) Verfahren zur Bestimmung der Quantisierungsverzerrung bei einem mit Impulscodemodulation arbeitenden Telefonsystem sowie Vorrichtung zur Durchführung dieses Verfahrens
DE1902376B2 (de) Elektronisches Musikinstrument
DE2062589C3 (de) Verfahren zur Ermittlung der Grundfrequenze eines wenigstens zeitweise periodischen Signales
EP0374374A2 (de) Verfahren und Vorrichtung zur Reduzierung der Nutzbandbreite eines bandbegrenzten Signals durch Kodieren desselben und Verfahren und Vorrichtung zum Dekodieren des bandbegrenzten Signals
DE3124194A1 (de) "frequenzabfuehlschaltung"
DE2613930A1 (de) Digitaler phasenregelkreis
DE2624636B2 (de) Deltamodulationskodieranordnung
DE2429744C3 (de) Schaltung zur Synthese von Signalen bestimmter, vorgegebener Bandbreite
DE3741423A1 (de) Digitale phaseneinstellung fuer digital generierte signale
DE2227476C2 (de) Verfahren und Anordnung zur Erzeugung quasi-synthetischer Sprache in einem Vocoder
DE1937258C3 (de) Vorrichtung zur Erzeugung der Fouriertransformierten einer Funktion
DE3045018C2 (de)
DE2834751C2 (de)

Legal Events

Date Code Title Description
OHN Withdrawal