DE2214521A1 - Sprachsyntheseschaltung - Google Patents
SprachsyntheseschaltungInfo
- Publication number
- DE2214521A1 DE2214521A1 DE19722214521 DE2214521A DE2214521A1 DE 2214521 A1 DE2214521 A1 DE 2214521A1 DE 19722214521 DE19722214521 DE 19722214521 DE 2214521 A DE2214521 A DE 2214521A DE 2214521 A1 DE2214521 A1 DE 2214521A1
- Authority
- DE
- Germany
- Prior art keywords
- frequency
- auxiliary
- generators
- information
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrophonic Musical Instruments (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
THOMSON - CSP
173» Bd. Haussmann
Paris 8e /!Frankreich
173» Bd. Haussmann
Paris 8e /!Frankreich
Unser Zeichen: T 1160
Sprachsyntheseschaltung
Die Erfindung bezieht sich auf eine Sprachsyntheseschaltung, die eine digitale Information empfängt, welche mit
einer Folgeperiode T, die einer Abtastperiode T enspricht, eine Information ausdrückt, die nachfolgend Hauptinformation
genannt wird und es ermöglicht, ein Sprachelement annähernd dadurch wieder herzustellen, daß für jede Abtastperiode
eine bestimmte Anzahl ρ von Sinussignalen addiert werden, deren Frequenz und Amplitude die Hauptinformation
bilden und die hier "Hauptkomponenten" genannt werden, wobei ρ gleich einer festen Zahl η oder kleiner
als diese ist. Die zuvor angegebene Hauptinformationsart ist in der PR-PS 2 044 290 angegeben. Kurz gesagt ist
eine Hauptkomponente ein zeitlicher Abschnitt eines Formanten, wobei ein Formant als eine zeitliche Folge von ·
Spektralkomponenten gleicher oder benachbarter Frequenzen
Lei/Gl
209 8 41 /081 2
_2_ ' 22H521
definiert ist, der einem (absoluten oder relativen) Energiemaximum in dem Sprachspektrum entspricht. Die
Formantenabschnitte, die für jede Abtastung der Sprache
übertragen v/erden, v/erden aufgrund von Kriterien bestimmt,
die in der zuvor angegebenen Patentschrift dargelegt sind. Die Analyse des Schalls erfolgt mit
Hilfe einer Filterbatterie, und die Frequenzen der Hauptkomponenten werden nur mit einer gewissen Annäherung
übertragen.
Das Ziel der Erfindung ist die Schaffung einer Sprachsyntheseschaltung
dieser Art, bei der es durch Verwendung einer Hilfsinformation möglich ist, die sprechende
Person in gewissem Maße zu identifizieren.
Diese Hilfsinformation ist die in der angelsächsischen Literatur "pitch information" genannte Information,
die hier Stimmhöheninformation genannt wird. Diese Information ist während der Abgabe von Vokalen und
stimmhaften Konsonanten ("voiced" in der angelsächsischen Literatur) durch eine Frequenz gebildet, welche
die Schwingungsfrequenz der Stimmbänder der sprechenden Person ist und kürzer "Stimmhöhenfrequenz" genannt werden
soll; sie liegt im allgemeinen zwischen 80 und 350 Hz, Die sich auf die Vokale und stimmhaften Konsonanten beziehenden
Spektralkomponenten sind Harmonische dieser Stimmhöhenfrequenz, was bei den stummen Konsonanten
("unvoiced" in der angelsächsischen Literatur) nicht der Fall ist.
Es sind bereits verschiedene Anordnungen für die sendeseitige Messung der Stimmhöhenfrequenz beschrieben worden.
Ein entsprechendes Literaturverzeichnis findet sich in dem Buch "Speech Analysis, Synthesis and Perception" von
209841/0812
J.L. Flanagan, Springer-Verlag, Berlin-Heidelberg-New
York, 1965.
Die einfachsten Anordnungen dieser Art arbeiten mit Spitzenwertdetektoren: Das Sprachsignal wird einem
Bandfilter oder, der höheren Sicherheit wegen, zwei Bandfiltern zugeführt, wodurch normalerweise ein Signal
geliefert wird, das bei der Abgabe von Vokalen oder stimmhaften Konsonanten mit der Stimmhöhenfrequenz
amplitudenmoduliert ist. Auf jedes dieser Bandfilter folgt ein Amplitudendetektor, dem wiederum ein Spitzenwertdetektor
nachgeschaltet ist, wobei die Frequenz der Spitzenwerte der Stimmhöhenfrequenz entspricht,
wenn diese in dem Signal in Erscheinung tritt; andernfalls liefert die Meßanordnung eine sehr stark schwankende
Ausgangsfrequenz.
Bei zahlreichen Systemen zur digitalen Sprachübertragung wird die von der Meßanordnung gelieferte Frequenz, die
hier Hilfsfrequenz genannt wird, dauernd auf einem Hilfskanal
übertragen, unabhängig davon, ob sie mit der Stiramhöhenfrequenz
identisch ist oder nicht; man überträgt jedoch außerdem ein Sondersignal, dessen Bildung einen
komplizierten Materialaufwand erfordert und das anzeigt, ob die Hilfsfrequenz die Stimmhöhenfrequenz ist. Wenn
dies zutrifft, erfolgt die Sprachsynthese mit Hilfe eines Generators, der Harmonische dieser Frequenz erzeugt,
die offensichtlich nur bis auf die Quantisierungen genau wiederhergestellt wird; andernfalls v/ird die Hilfsfrequenz
nicht verwendet, und die Synthese erfolgt mit Hilfe eines Rauschgenerators.
Bei der in der zuvor erwähnten französischen Patentschrift beschriebenen Sprachsyntheseschaltung, bei der
2098A1/0812
22H521
die Synthese nach einem völlig anderen Prinzip mit Hilfe einer kleinen Anzahl von "Hauptkomponenten"
erfolgt, wird die Stimmhöheninformation nicht verwendet.
Die Erfindung ermöglicht die Ausnutzung der Stimmhöheninformation durch gleichzeitige Rückstellungen
auf vorbestimmte Phasen für alle Hauptkomponenten, wobei diese Rückstellungen auf vorbestimmte Phasen
mit der Stimmhöhenfrequenz erfolgen; dadurch ist es möglich, das Summensignal der Hauptkomponenten mit
dieser Frequenz periodisch zu machen.
Nach der Erfindung ist eine Sprachsyntheseschaltung zur synthetischen Spracherzeugung aufgrund einer periodischen
Information, die eine Hauptinformation enthält, die sich auf ein Sprachelement bezieht und durch die
Frequenzen und Amplituden von ρ sinusförmigen Hauptkomponenten gebildet ist, wobei ρ eine veränderliche
Zahl ist, die höchstens gleich einer festen Zahl η >1 ist, mit η frequenzveränderlichen Generatoren und η Amplitudeneinstellanordnungen,
die jeweils einem der η Generatoren zugeordnet sind, wobei die η Generatoren und
Amplitudeneinstellanordnungen durch die Hauptinformation für die Wiederherstellung der Hauptkomponenten gesteuert
werden, und mit einer Addierschaltung, welche die Summe der wiederhergestellten Hauptkomponenten bildet, dadurch
gekennzeichnet, daß zur Verwendung einer Hilfsinformation,
die durch eine Hilfsfrequenz gebildet ist, die während der Aussendung von Vokalen und stimmhaften Konsonanten
die Schwingungsfrequenz der Stimmbänder der sprechenden Person ('Btimmhöhenfrequenz") ist, eine Anordnung zur
Rückstellung jeder der wiederhergestellten Hauptkomponenten auf eine vorbestimmte Phase vorgesehen ist, wobei
2098A 1 /0812
die Rückstellungen auf die vorbestimmten Phasen für die
Haupt !componenten gleichzeitig stattfinden und von der
Hilfsinformation so gesteuert werden, daß sie mit der
Hilfsfrequenz wenigstens dann erfolgen, wenn die Hilfsfrequenz die Stimmhöhenfrequenz ist.
Ein Ausführungsbeispiel der Erfindung ist in der Zeichnung dargestellt, deren einzige Figur das Blockschaltbild
einer bevorzugten Ausführungsform einer Sprachsyntheseschaltung nach der Erfindung zeigt.
Die Zeichnung zeigt die Informationsquelle 1, die zur
Speisung der Sprachsyntheseschaltung bestimmt ist.
Diese Informationsquelle kann beispielsweise die letzte Stufe einer Empfangsanordnung sein, welche die für die
Sprachsynthesesehaltung notwendigen Informationen in
Form von parallelen Binärsignalen liefert. Jede der aufeinanderfolgenden Informationen wird an den Ausgängen
der Informationsquelle 1 für eine Periode T aufrecht erhalten, die der Analyseperiode gleich ist.
Es ist hier angenommen, daß die maximale Anzahl η von Hauptkomponenten 3 beträgt.
Die Informationsquelle 1 hat also sieben Mehrfachausgänge (von denen jeder Draht einer Binärziffer entspricht),
nämlich die Ausgänge 11, 12 und 13, welche die Frequenzen F.., Pp bzw. F-Z der Hauptkomponenten liefern, die Ausgänge
21, 22, und 23, welche die entsprechenden Aplituden A^,
Ap bzw. A^ liefern, und schließlich den Ausgang 10, der
die Hilfsfrequenz f liefert." Wie noch zu sehen sein wird, ist es überflüssig, dem Gerät ein Sondersignal zu liefern,
das anzeigt, ob die Hilfsfrequenz während des Empfangs die Stimmböhenfrequenz ist oder nicht.
209841/0812
22U521
Die Ausgänge 11, 12, 13 sind jeweils mit einer von drei
Codeumsetzerschaltungen 31» 32 bzw. 33 verbunden, welche
den die Frequenzen F1, Fp, F, darstellenden Digitalinformationen
(die im allgemeinen durch die Identifizierungsnummer eines Analysefilters gegeben sind) die folgenden
Zahlen zuordnen:
F Fr> J?
N1 = ^ N = N =
wobei F eine Frequenz ist, die sehr viel höher als das
sendeseitig analysierte Tonfrequenzband (beispielsweise
bis 3500 Hz) ist, während q eine feste ganze Zahl ist, beispielsweise in der Größenordnung von 10.
Drei mit Zählung arbeitende veränderliche Frequenzteiler 41, 42, 43 empfangen die Impulse eines Taktgebers
2 mit der Frequenz F . Diese Frequenzteiler sind jeweils mit Mehrfach-Steuereingängen versehen, die an
die Ausgänge der Codeumsetzerschaltungen 31, 32 bzw. 33 angeschlossen sind, und ihre Ausgänge sind mit den
Frequenzsteuereingängen 61, 62 bzw. 63 von drei Signalgeneratoren 51, 52 bzw. 53 verbunden, denen sie Impulse
der Frequenz 2qF., 2qFp bzw. 2qF, zuführen.
Jeder dieser drei Generatoren ist in an sich bekannter Weise so ausgeführt, daß er im wesentlichen ein Verschieberegister
mit q Stufen enthält, dessen Ausgang mit dem Eingang über einen Negator verbunden ist, der eine Ziffer "1"
in eine Ziffer "0" und umgekehrt umformt. Die q Stufen sind jeweils mit Hilfsausgängen versehen, die mit einer
Schaltung verbunden sind, die ein von einer Spannungsquelle gespeistes Widerstandsnetzwerk enthält. Das Verschieberegister
wird anfänglich in geeigneter Weise gefüllt, beispielsweise mit q Ziffern "O". Der Inhalt
209 8 Λ 1 /081 2
22U521
des Verschieberegisters ändert sich mit jedem Fortschalteimpuls,
und die Stellung der Ziffern "1" in dem Verschieberegister bestimmt die Widerstände, die
zur Bildung des Ausgangssignals des Generators beitragen. Dieses Ausgangssignal ist also durch eine
Treppenspannung gebildet. Das Widerstandsnetzwerk ist so berechnet, daß für jeweils 2q Fortschalteimpulse,
die mit einer festen Folgeperiode geliefert werden, die Hüllkurve des Ausgangssignals (bis auf eine Gleich-Stromkomponente)
einen Zyklus einer Sinusschwingung darstellt.
Für eine periodische Folge von Fortschalteimpulsen
liefert' der Generator ein Treppensignal, das eine be- , stimmte Anzahl von Zyklen enthält, und dieses Treppensignal
braucht nur durch ein Tiefpaßfilter geschickt zu werden, damit es in ein sinusförmiges Signal umgeformt
wird, während die Gleichstromkomponente normalerweise verloren geht, beispielsweise durch die vorgenommenen
Verstärkungen.
Derartige Generatoren sind in dem Aufsatz "Digital Generation of Low-Frequency Sine Waves" von Anthony C.
Davies in der Zeitschrift "IEEE Transactions of Instrumentation and Measurement", Band IM 18, Nr. 2, Juni 1969,
Seiten 97 bis 105 beschrieben. Solche Generatoren und ganz allgemein alle Sinusgeneratoren, bei denen ein
Widerstandsnetzwerk verwendet wird, das durch ein Verschieberegister umgeschaltet wird, werden hier "Verschieberegister-Widerstandsnetzwerk—Generatoren"
genannt.
Unter diesen Voraussetzungen sind in dem Schaltbild die
Eingänge 61, 62 und 63 der Generatoren 51, 52 bzw. 53 die Eingänge der Fortschalteanordnung der darin enthaltenen
Verschieberegister.
2098^1/0812
Es ist leicht zu erkennen, daß unter diesen Bedingungen die drei Generatoren jeweils Ausgangsspannungen liefern,
deren Hüllkurven (bis auf eine Gleichstromkomponente)
Abschnitte von Sinuskurven mit der Frequenz P., Fp bzw. F,
sind.
Es ist auch leicht zu erkennen, daß der Inhalt des Verschieberegisters in einem gegebenen Zeitpunkt die
Phase des sinusförmigen Signals in diesem Zeitpunkt bestimmt.
Die drei Generatoren haben ferner Eingänge 71, 72 bzw. 73, welche die Nullrückstellung aller Stufen ihrer Verschieberegister
ermöglichen, wobei dieser Zustand des entsprechenden Verschieberegisters der Phase +270° des
sinusförmigen Signals entspricht.
Die drei Generatoren speisen jeweils eines von drei veränderlichen
Dämpfungsgliedern 81, 82 bzw. 83, deren Steuereingänge mit den Ausgängen 21, 22 bzw. 23 der
Informationsquelle 1 über einen von drei Digital-Analog-Umsetzern 91j 92 bzw. 93 verbunden sind.
Hier ist folgendes zu bemerken: Wenn für eine gegebene Abtastperiode ρ kleiner als η oder sogar Null (Schweigeperioden)
ist, läßt sich diese Information leicht durch eine Information der Amplitude 0 auf den Kanälen ausdrücken,
was dem Nichtvorhandensein von Hauptkomponenten entspricht, so daß es bedeutungslos ist, wie sich die
entsprechenden Generatoren in der betreffenden Periode verhalten, da ihre eventuellen Ausgangssignale dann
durch die einstellbaren Dämpfungsglieder gesperrt werden.
Die Ausgangssignale der Dämpungsglieder 81, 82 und 83
2 0 9 8 Λ 1/0812
werden in einer Addierschaltung 55 addiert. Die am
Ausgang der Addierschaltung 55 erscheinenden Signale haben infolge einer Kopplungskapazität, die an einem
beliebigen geeigneten Punkt eingefügt ist, ihre Gleichstromkomponenten verloren. Der Ausgang der Addierschaltung
55 speist den Trägerfreqüenzeingang eines Amplitudenmodulators 65» dessen Ausgang mit dem Eingang
eines das Ausgangssignal der Sprachsyntheseschaltung
darstellenden elektroakustischen Wandlers 85 über ein Tiefpaßfilter 75 verbunden ist.
Die Hilfsfrequenz wird bei dieser bevorzugten Ausführungsform der Sprachsyntheseschaltung nicht nur für die
zuvor erwähnten Rückstellungen auf vorbestimrate Phasen verwendet, sondern auch für eine (im Modulator 65 erfol- m
gende)Araplitudenmodulation des Ausgangssignals der Addierschaltung 55» und zwar in der Weise, daß der
Augenblickswert des Modulationssignals mit der Frequenz f bei den Rückstellungen auf vorbestimrate Phasen durch ein
Minimum geht. Der dadurch erhaltene Gesamteffekt ist sehr befriedigend.
Bei dem angegebenen Ausführungsbeispiel wird die Phase jeder Hauptkomponente auf den gleichen festen Wert zurückgestellt,
der dem Inhalt 0 in allen Stufen jedes Verschieberegisters entspricht.
Schließlich wird bei diesem Ausführungsbeispiel an den Schaltungen nichts geändert, wenn die Hilfsfrequenz
nicht die Höhenfrequenz ist, wodurch das zuvor erwähnte Sondersignal entfällt. Die erratischen Frequenzen, die
nacheinander die Hilfsfrequenz bei der Abgabe von stummen Konsonanten bilden, führen zu Phasenrückstellungen und
zu einer Amplitudenmodulation, die sich erratisch von
2098A1/0812
22U521 - ίο -
einer Syntheseperiode zur nächsten ändern, und es ist festgestellt worden, daß der dadurch für die Synthese
von stummen Konsonanten erhaltene Höreffekt eine bessere Qualität hatte, als sie erhalten wird, wenn die Phasenrückstellungen
und die Amplitudenmodulation für die Synthese von stummen Konsonanten unterdrückt werden.
Dadurch werden außerdem die Schaltungen vereinfacht.
Somit speist bei der dargestellten Schaltung der Ausgang 10 der Informationsquelle 1 die Erzeugung eines
Signals der Frequenz f eine Schaltung von gleicher Art, wie sie hinsichtlich der Frequenz für die treppenförmigen
Signale mit den Frequenzen F.., Fp, F., verwendet
wird.
Diese Schaltung enthält eine Codeumsetzerschaltung 30,
auf die ein einstellbarer Frequenzteiler 40 und ein Generator 50 folgen.
Da jedoch die Frequenz f unter den Frequenzen der Mehrzahl der Hauptkomponenten liegt, erfolgt die 'Zuführung
von Impulsen zu dem einstellbaren Frequenzteiler 40 durch einen festen Frequenzteiler 90, der seinerseits
von dem Taktgeber 2 gespeist wird.
Das von dem Generator 50 gelieferte Ausgangssignal mit der Frequenz f wird dem Modulationseingang des Modulators
65 zugeführt. Bei diesem Beispiel ist das Modulationssignal das vom Generator 50 gelieferte treppenförraige
Signal, das nicht von seiner Gleichstromkomponente befreit ist, so daß es durch ein Minimum des
Wertes 0 geht, wenn das Verschieberegister des Generators 50 nicht mit Nullen gefüllt ist; ferner ist die
Modulationstiefe so eingestellt, daß das modulierte
209841/0812
Signal gleichzeitig mit dem Modulationssignal zu Null
wird. Das Ausgangssignal des Modulators 65 geht dann durch das Tiefpaßfilter 75, welches das Ausgangssignal
des Modulators 65 glättet und dadurch die Unstetigkeiten zum Verschwinden bringt, die von den Treppenstufen sowohl
des Modulationssignals als auch des modulierten Signals stammen.
Die Nulldurchgänge des Ausgangssignals des Generators werden mit Hilfe einer Decodierschaltung festgestellt,
die hier nur aus einem einfachen llWeder~Noch"-Gatter
besteht, das zwei Eingänge hat, die mit den beiden äußersten Stufen des Verschieberegisters im Generator 50 verbunden
sind. Es läßt sich nämlich leicht nachprüfen, daß dieses Verschieberegister nur dann gleichzeitig eine
Null in jeder dieser beiden äußersten Stufen aufweisen kann, wenn alle Stufen im Zustand 0 sind. Das Ausgangssignal
des Gatters 35 wird den Eingängen 71, 72 und 73 der Generatoren 51, 52 bzw. 53 zugeführt und bewirkt
dadurch die Rückstellungen auf die vorbestimmte Phase in den gewünschten Augenblicken.
Eine Weiterbildung, durch welche die Wiederherstellung der Vokale und der stimmhaften Konsonanten verbessert
wird, besteht darin, daß als Modulationssignal ein periodisches Signal der Periode 0=1/f verwendet wird,
von dem ein Zyklus durch zwei sinusförmige Halbzyklen (bis auf die Gleichstromkomponenten, welche ihnen den
Miniraalwert Null erteilen) mit der Dauer 0/4 für den
Anstieg von Null bis zum Maximum und der Dauer 3 0/4
für den Wiederabfall vom Maximum auf Null gebildet ist.
Aufgrund dieser Unsymmetrie kann man dann nicht mehr einen Generator verwenden, dessen Verschieberegister q
Stufen enthält, um ein Signal der Frequenz f mit Hilfe
209841 /0812
22H521
von Portschalteimpulsen der Folgefrequenz 2 q f zu erhalten.
Man kann jedoch beispielsweise einen gleichartigen Generator verwenden, dessen Verschieberegister 2 q
Stufen enthält und anfänglich mit einer Ziffer "1" und (2q-1) Ziffern »0» gefüllt wird, wobei die Schleife
zwischen dem Eingang und dem Ausgang des Verschieberegisters keinen Negator enthält.
Man verwendet dann ein Netzwerk von 2q Widerständen, von denen jeder wahlweise für eine Stelle der Ziffer "1"
an die Spannungsquelle angeschlossen wird, wodurch es möglich ist, einem Zyklus des treppenförmigen Signals
jede gewünschte Form zu erteilen.
Eine gegebene Phase der Hüllkurve des Ausgangssignals wird dadurch angezeigt, daß in einer gegebenen Stufe
die einzige im Verschieberegister umlaufende Ziffer "1" festgestellt wird, und der Ausgang dieser Stufe kann
direkt die Rückstellungen auf die vorbestimmte Phase steuern.
Eine andere Lösung besteht darin, daß der Generator von Pig. 1 beibehalten wird, und daß ihm Portschalteimpulse
zugeführt werden, deren Frequenz für die ansteigenden Abschnitte des Signals (Übergang des Verschieberegisters
vom Zustand "lauter 0" zum Zustand "lauter 1") dreimal größer als für die abfallenden
Signalabschnitte (Rückkehr in den Zustand "lauter 0") ist.
2 0 9 8 Λ 1/0812
Claims (3)
- Patentansprüche1J Sprachsyntheseschaltung zur synthetischen Spracherzeugung auf Grund einer periodischen Information, die eine Hauptinformation enthält, die sich auf ein Sprachelement be-* zieht und durch die Frequenzen und Amplituden von ρ sinusförmigen Hauptlcomponenten gebildet ist, wobei ρ eine veränderliche Zahl ist, die höchstens gleich einer festen Zahl n>1 ist, mit η frequenzveränderlichen Generatoren und η Amplitudeneinstellanordnungen, die jeweils einem der η Generatoren zugeordnet sind, wobei die η Generatoren und Amplitudeneinstellanordnungen durch die Hauptinformation für die Wiederherstellung der Haupt !componenten gesteuert werden, und mit einer Addierschaltung, welche* die Summe der wiederhergestellten Hauptkomponenten bildet, dadurch gekennzeichnet, daß zur Verwendung einer Hilfsinformation, die durch eine Hilfsfrequenz gebildet ist, die während der Aussendung von Vokalen und stimmhaften Konsonanten die Schwingungsfrequenz der Stimmbänder der entsprechenden Person ("Stimmhöhenfrequenz11) ist, eine Anordnung zur Rückstellung jeder der wiederhergestellten Hauptkomponenten auf eine vorbestimmte Phase vorgesehen ist, wobei die Rückstellungen auf die vorbestimmten Phasen für die Hauptkomponenten gleichzeitig stattfinden und von der Hilfsinformation so gesteuert werden, daß sie mit der Hilfsfrequenz wenigstens dann erfolgen, wenn die Hilfsfrequenz die Stimmhöhenfrequenz ist.
- 2. Sprachsyntheseschaltung nach Anspruch 1, dadurch gekennzeichnet, daß die Rückstellungen auf vorbestimmte Phasen mit der Hilfsfrequenz unabhängig davon durchgeführt werden, ob diese die Stimmhöhenfrequenz ist oder nicht, daß eine Amplitudenmodulationsanordnung für die209841 /0812Amplitudenmodulation des Summensignals der Hauptkomponenten durch ein Modulationssignal mit der Hilfsfrequenz vorgesehen ist, und daß die Rückstellungen auf vorbestimmte Phasen dann erfolgen, wenn der Augenblickswert des Modulationssignals durch ein Minimum geht.
- 3. Sprachsyntheseschaltung nach Anspruch 2, gekennzeichnet durch einen frequenzveränderlichen Hilfsgenerator, der von der Hilfsinformation so gesteuert wird, daß er ein Signal mit der Hilfsfrequenz liefert, und daß jeder der η Generatoren und der Hilfsgenerator ein Verschieberegister-Widerstandsnetzwerks-Generator ist, wobei das Verschieberegister jedes der η Generatoren einen Phasensteuereingang aufweist, der die Rückstellung des Verschieberegisters in einen vorbestimmten Zustand ermöglicht, daß die Phasenrückstellanordnung durch den Hilfsgenerator und durch eine Decodieranordnung, die dann ein Steuersignal liefert, wenn das Verschieberegister des Hilfsgenerators sich in einem vorbestimmten Zustand befindet, gebildet ist, daß der Ausgang der Decodieranordnung mit den Phasensteuereingängen verbunden ist, und daß die Amplitudenmodulationsanordnung durch den Hilfsgenerator und durch einen Amplitudenmodulator, dessen Trägereingang mit dem Ausgang der Addierschaltung und dessen Modulationseingang mit dem Ausgang des Hilfsgenerators verbunden sind, gebildet ist.209841/0812
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR7110824A FR2130952A5 (de) | 1971-03-26 | 1971-03-26 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE2214521A1 true DE2214521A1 (de) | 1972-10-05 |
Family
ID=9074226
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE19722214521 Pending DE2214521A1 (de) | 1971-03-26 | 1972-03-24 | Sprachsyntheseschaltung |
Country Status (10)
| Country | Link |
|---|---|
| US (1) | US3830977A (de) |
| AU (1) | AU463038B2 (de) |
| BE (1) | BE781116A (de) |
| DE (1) | DE2214521A1 (de) |
| FR (1) | FR2130952A5 (de) |
| GB (1) | GB1364775A (de) |
| IT (1) | IT952370B (de) |
| NL (1) | NL7203873A (de) |
| SE (1) | SE375178B (de) |
| ZA (1) | ZA721392B (de) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB1541429A (en) * | 1975-12-19 | 1979-02-28 | Int Computers Ltd | Speech synthesising apparatus |
| US4051331A (en) * | 1976-03-29 | 1977-09-27 | Brigham Young University | Speech coding hearing aid system utilizing formant frequency transformation |
| US4566117A (en) * | 1982-10-04 | 1986-01-21 | Motorola, Inc. | Speech synthesis system |
| US5140639A (en) * | 1990-08-13 | 1992-08-18 | First Byte | Speech generation using variable frequency oscillators |
| RU2296377C2 (ru) * | 2005-06-14 | 2007-03-27 | Михаил Николаевич Гусев | Способ анализа и синтеза речи |
| CN111627451B (zh) * | 2013-06-21 | 2023-11-03 | 弗朗霍夫应用科学研究促进协会 | 用于获取音频信号的替换帧的频谱系数的方法及相关产品 |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3268660A (en) * | 1963-02-12 | 1966-08-23 | Bell Telephone Labor Inc | Synthesis of artificial speech |
| US3394228A (en) * | 1965-06-03 | 1968-07-23 | Bell Telephone Labor Inc | Apparatus for spectral scaling of speech |
| US3491205A (en) * | 1966-09-29 | 1970-01-20 | Philco Ford Corp | Plural formant speech synthesizer |
| US3499991A (en) * | 1967-08-01 | 1970-03-10 | Philco Ford Corp | Voice-excited vocoder |
| GB1225142A (de) * | 1967-11-29 | 1971-03-17 |
-
1971
- 1971-03-26 FR FR7110824A patent/FR2130952A5/fr not_active Expired
-
1972
- 1972-03-01 ZA ZA721392A patent/ZA721392B/xx unknown
- 1972-03-03 US US00231558A patent/US3830977A/en not_active Expired - Lifetime
- 1972-03-23 NL NL7203873A patent/NL7203873A/xx not_active Application Discontinuation
- 1972-03-23 BE BE781116A patent/BE781116A/xx unknown
- 1972-03-24 DE DE19722214521 patent/DE2214521A1/de active Pending
- 1972-03-24 AU AU40375/72A patent/AU463038B2/en not_active Expired
- 1972-03-24 SE SE7203892A patent/SE375178B/xx unknown
- 1972-03-24 IT IT49208/72A patent/IT952370B/it active
- 1972-03-24 GB GB1399472A patent/GB1364775A/en not_active Expired
Also Published As
| Publication number | Publication date |
|---|---|
| SE375178B (de) | 1975-04-07 |
| ZA721392B (en) | 1972-11-29 |
| BE781116A (fr) | 1972-07-17 |
| US3830977A (en) | 1974-08-20 |
| NL7203873A (de) | 1972-09-28 |
| FR2130952A5 (de) | 1972-11-10 |
| GB1364775A (en) | 1974-08-29 |
| AU4037572A (en) | 1973-09-27 |
| AU463038B2 (en) | 1975-06-26 |
| IT952370B (it) | 1973-07-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE2162486A1 (de) | Digital gesteuerter Impulsgenerator | |
| DE2840596A1 (de) | Sprachsynthesizer | |
| DE2530380A1 (de) | Sprachsynthetisatorsystem | |
| DE2644478A1 (de) | Differential-phasenumtast-modulator | |
| DE2214521A1 (de) | Sprachsyntheseschaltung | |
| DE2523625A1 (de) | Digitalfilter | |
| DE2850059A1 (de) | Digital/analog-wandler | |
| DE2130935A1 (de) | Digital-Filtergeraet | |
| DE2435654C2 (de) | Verfahren und Vorrichtung zur Analyse und Synthese von menschlicher Sprache | |
| CH647112A5 (de) | Schaltungsanordnung zur gewinnung einer zu der impulsdichte einer impulsfolge proportionalen steuerspannung. | |
| DE2051589A1 (de) | Anordnung zur Synthese eines Signals | |
| DE1122581B (de) | Verfahren und Schaltungsanordnung zur angenaeherten Nachbildung der Kurzzeitspektren von nach dem Vocoderverfahren uebertragenen Sprachsignalen | |
| DE2850240C2 (de) | Verfahren zur Bestimmung der Quantisierungsverzerrung bei einem mit Impulscodemodulation arbeitenden Telefonsystem sowie Vorrichtung zur Durchführung dieses Verfahrens | |
| DE1902376B2 (de) | Elektronisches Musikinstrument | |
| DE2062589C3 (de) | Verfahren zur Ermittlung der Grundfrequenze eines wenigstens zeitweise periodischen Signales | |
| EP0374374A2 (de) | Verfahren und Vorrichtung zur Reduzierung der Nutzbandbreite eines bandbegrenzten Signals durch Kodieren desselben und Verfahren und Vorrichtung zum Dekodieren des bandbegrenzten Signals | |
| DE3124194A1 (de) | "frequenzabfuehlschaltung" | |
| DE2613930A1 (de) | Digitaler phasenregelkreis | |
| DE2624636B2 (de) | Deltamodulationskodieranordnung | |
| DE2429744C3 (de) | Schaltung zur Synthese von Signalen bestimmter, vorgegebener Bandbreite | |
| DE3741423A1 (de) | Digitale phaseneinstellung fuer digital generierte signale | |
| DE2227476C2 (de) | Verfahren und Anordnung zur Erzeugung quasi-synthetischer Sprache in einem Vocoder | |
| DE1937258C3 (de) | Vorrichtung zur Erzeugung der Fouriertransformierten einer Funktion | |
| DE3045018C2 (de) | ||
| DE2834751C2 (de) |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| OHN | Withdrawal |