DE958305C - Einrichtung zur Wiedergabe von Sprachlauten, die in Abhaengigkeit von unter Frequenzbandeinengung uebertragenen Zeichen zu Worten zusammengefuegt werden - Google Patents
Einrichtung zur Wiedergabe von Sprachlauten, die in Abhaengigkeit von unter Frequenzbandeinengung uebertragenen Zeichen zu Worten zusammengefuegt werdenInfo
- Publication number
- DE958305C DE958305C DEK18340A DEK0018340A DE958305C DE 958305 C DE958305 C DE 958305C DE K18340 A DEK18340 A DE K18340A DE K0018340 A DEK0018340 A DE K0018340A DE 958305 C DE958305 C DE 958305C
- Authority
- DE
- Germany
- Prior art keywords
- sound
- speech
- sounds
- speech sounds
- playback
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 230000015654 memory Effects 0.000 claims description 13
- 230000009977 dual effect Effects 0.000 claims description 8
- 230000003287 optical effect Effects 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000004804 winding Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 1
- 230000036540 impulse transmission Effects 0.000 description 1
- 239000011295 pitch Substances 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Description
Die Erfindung bezieht sich auf eine Einrichtung zur Wiedergabe von Sprache, bei der für die Übertragung
der Sprache eine gegenüber der Originalbandbreite wesentlich geringere Bandbreite beansprucht
wird.
Es sind bereits derartige Nachrichtenübertragungseinrichtungen bekanntgeworden. Ihr Zweck
ist es, die Nachrichtenkapazität von hochwertigen Übertragungswegen ungeachtet des höheren Endstellenaufwandes
möglichst gut auszunützen.
So ist z. B. ein Verfahren bekannt, bei dem ein Sprachband von 250 bis 7100 Hz auf ein schmales
Band von 360 Hz Breite gebracht wird. Dabei gelangt man über die Sprachanalyse auf die Sprachsynthese,
d. h. auf die Erzeugung künstlicher Sprache. Die menschliche Sprache enthält »feste«
und »veränderliche« Bestandteile. Die festen Bestandteile werden am Wiedergabeort von festen
Oszillatoren geliefert. Die veränderlichen Bestandteile werden übertragen. Die festen Oszillatoren
(Generatoren) werden durch ebenfalls übertragene Kennzeichen gesteuert.
Eine Möglichkeit der Sprachsynthese besteht auch darin, die Sprachlaute auf optischem Wege
durch Frequenz und zeitlichen Verlauf darzustellen und das Diagramm, das die Laute in vereinfachter
Weise schematisch repräsentiert,, zur Wiedergabe optisch abzutasten und zu Worten zusammenzusetzen.
Dieses Verfahren verlangt jedoch, daß die Nachricht selbst zur Aufzeichnung vorliegt und
das Ergebnis der erforderlichen Analyse in einem Frequenz-Zeit-Diagramm dargestellt wird, das indessen
auch noch bei erheblichen Vereinfachungen eine brauchbare Wiedergabe des in dem Diagramm
festgehaltenen Nachrichteninhalts ermöglicht. Diese Vereinfachung der Aufzeichnung erfordert für eine
Übertragung einen entsprechend geringeren Aufwand an Bandweite. Man kann eine noch wesentlich
weitergehendere Einengung des für einen
ίο Kanal benötigten Frequenzbandes erreichen, indem
bei einer Einrichtung zur Wiedergabe von Sprachlauten, die in Abhängigkeit von unter Frequenzbandeinengung
übertragenen Zeichen zu Worten zusammengefügt werden, erfindungsgemäß die den übertragenen Zeichen entsprechenden Laute bzw.
Lautverbindungen als fertige natürliche Laute bzw. Lautverbindungen aus Magnetton- oder Lichttonspeichern
entnommen werden.
Man fügt dabei die Laute zur Wiedergabe von Nachrichten in beliebiger Weise in der richtigen
zeitlichen Reihenfolge zu Wörtern und Sätzen zusammen.
Dieses Verfahren hat für die elektrische Übertragung von Sprache den Vorteil, daß die Übertragung
mit einem Minimum an Nachrichtenkapazität durchgeführt werden kann. Rechnet man z. B. mit N gespeicherten Sprachlauten (einschließlich
der verschiedenen Tonhöhen, Lautstärken, Klangfarben und Lautverbindungen), so sind zur
Auswahl eines Sprachlautes jeweils m = 2 log ΛΓ
Nachrichteneinheiten (Zweierschritte oder Telegraphierimpulse) erforderlich. Sollen η Sprachlaute
oder Lautverbindungen je Zeiteinheit übertragen werden, dann ist die erforderliche Nachrichtenkapazität
des Übertragungskanals
C = n2log N Nachrichteneinheiten.
Zum Beispiel für N = 500 und η = iooo jeMinute
C = 150 Nachrichteneinheiten je Sekunde.
Diese Nachrichtenkapazität erfordert bei Impulsübertragung mit einem Störverhältnis, das
kleiner als V2 ist, ein Frequenzband von der Breite 75 Hz gegenüber mindestens 3000 Hz und einem
Störverhältnis von höchstens einem Fünfzigstel bei gewöhnlicher Sprachübertragung.
Die Erfindung wird nun an Hand der Fig. 1 bis 4 und eines speziellen Ausführungsbeispiels eingehend
beschrieben.
So Fig. ι zeigt als Beispiel den natürlichen Zeitverlauf
des Wortes »aber«;
Fig. 2 zeigt vier Speicherbahnen für die »normierten Sprachlaute« des Wortes »aber«, die zugehörigen
Wiedergabeköpfe und die Abfrageschalter;
Fig. 3 zeigt eine beispielsweise Anordnung des Abfragemechanismus, bei dem nur Relais verwendet
werden;
Fig. 4 zeigt eine Speicheranordnung für Dualsignale.
In Fig. ι ist nun an Hand des als Beispiel gewählten
Wortes »aber« in einem Diagramm der etwa natürliche zeitliche Ablauf dieses Wortes für
einen willkürlich herausgegriffenen Fall dargestellt. Da nun die Sprachlaute zu ganz bestimmten Zeitpunkten
entnommen werden müssen, damit sie zur Bildung der Wörter ohne Lücken oder Überlappungen
zusammenschließen, erweist es sich als notwendig, dabei eine Vereinfachung einzuführen.
Die Dauer des Wortes »aber« ist in dem gewählten Beispiel 1060 ms = i,o6 see. Soll das
Wort in einem bestimmten Zeitpunkt beginnen, dann muß dieser Zeitpunkt mit dem Beginn des
aus dem Lautspeicher zu entnehmenden Vokals a zusammenfallen. Nach Beendigung des Vokals a,
520 ms später, muß das b einsetzen. Die Aufgabe könnte im Prinzip dadurch gelöst werden, daß die
erwähnten, mechanisch angetriebenen Speicher immer im erforderlichen Zeitpunkt an einen ständig
laufenden Motor angekuppelt werden. Dies stellt jedoch technisch schwierige Zeitbedingungen
für die Kupplung. Gemäß einer weiteren Ausbildung der Erfindung werden mechanische Kupplungen
dieser Art völlig vermieden, so daß die Lautspeicher ständig gleichmäßig laufen können. Zu
diesem Zweck werden Sprachlaute und Lautverbindungen erstens in ihrer Dauer als ganzzahlige
Vielfache einer Gfundzeitspanne gewählt, und zweitens in Zeitabständen, die gleich dieser Grundzeit
sind, abgetastet.
Die Grundzeit kann z. B. zu 50 ms gewählt werden. Dann soll die Zeitdauer aller anderen
Laute entweder gleich 50 ms oder ein ganzzahliges Vielfaches davon sein. So kann z. B. ein »a« zu
400 ms Zeitdauer gewählt werden. Dieser Laut kann auf ein Band von z. B. 320 mm Länge aufgezeichnet
sein, das den Umfang einer mit 2,5 Umdrehungen je Sekunde rotierenden Trommel bildet.
In Abständen von 40 mm (entsprechend 5°ms)
längs des Umfanges sind Wiedergabeköpfe angeordnet, in dem Beispiel 8 Stück. Der Vokal »a«
beginnt also in jedem Wiedergabekopf um 50 ms später als im vorhergehenden. Auf diese Weise
ergibt sich die Möglichkeit, die Sprachlaute durch ■einfaches Umschalten zwischen den entsprechenden
Wiedergabeköpfen aneinanderzureihen.
Fig. 2 zeigt schematisch die vier Speicherbahnen für vier willkürlich herausgegriffene Sprachlaute,
wobei das »a« 400 ms, das- »b« 5° ms, das »e« 200 ms und das »r« 200 ms für einen Umlauf
brauche. Alle diese Zeitspannen sind ganzzahlige Vielfache der Grundzeit von 50 ms. Dementsprechend
finden sich am Umfang der Speicherbänder beim »a« acht Wiedergabeköpfe, die mit 1 bis 8
bezeichnet sind, beim »b« ein Wiedergabekopf, beim »e« und »r« je vier Wiedergabeköpfe. Die
Wiedergabeköpfe stehen über Schalter mit den elektrischen Ausgängen A, B, E, R in Verbindung.
Diese Schalter verbinden jeweils denjenigen Wiedergabekopf mit dem Ausgang, der den Beginn des iao
Sprachlautes aufnimmt. Soll nun ein Sprachlaut am Ausgang entnommen werden, dann wird der
betreffende Schalter für eine Umdrehung des Lautspeichers stillgesetzt.
Es handle sich z. B. um die Wiedergabe des Wortes »aber«. Der Schalter für »a«, der synchron
mit dem Tonband »a« umläuft, befinde sich beim Beginn des Wortes gerade auf dem Wiedergabekopf
3. Nach Ablauf des Sprachlautes wird auf das »b« umgeschaltet, nach Ablauf des »b« auf
S das »e«. Dort befinde sich der Schalter z. B. auf Stellung 2. Er wird stillgehalten, bis das »e« abgelaufen
ist; dann wird auf »r« übergeschaltet, wo sich der Drehschalter ebenfalls gerade auf 2 befindet.
Die vier. Sprachlaute können also auf diese Weise lückenlos aneinandergereiht werden.
Der Schaltermechanismus kann unter Benutzung der bekannten technischen Hilfsmittel der Wählerund
Schaltertechnik in verschiedener Weise ausgeführt werden.
Fig. 3 zeigt ein Beispiel, bei dem nur Relais verwendet werden. Die Anordnung ist so getroffen,
daß die Relais nur dann arbeiten, wenn der Spracblaut angefordert wird, so daß der Schaltermechanismus
nicht unnötig beansprucht wird.
M ist d?.s abgewickelte Magnettonband, z. B. für
den Laut »r«, K1, K2 sind Kontaktstreifen, auf
denen die Bürsten o, 1, 2, 3, 4 schleifen. In der Abwicklung bewegen sich die Bänder von rechts
nach links, wie es der Pfeil angibt.
Der Anfang des Sprachlautes befinde sich in der gezeichneten Stellung vor dem Wiedergabekopf W3.
Der Kontaktstreifen K2 stellt die Verbindung zwischen
Bürste ο und Bürste 3 her. Der Sprachlaut kann durch die Taste 6" angefordert werden. Wird
diese Taste nicht gedrückt, dann sind die Stromkreise sämtlicher Relaiswicklungen offen, so daß
keines der Relais betätigt wird. Schließt man den Schalter S, dann spricht zunächst Relais X3 an,
über Pluspol, Wicklung X3, Relaiskontakt 2,
Bürste 3, Kontaktstreifen K2, Kontaktstreifen K1,
Bürste o, Schalter S, Wicklung Z, Minuspol. Damit wird der Wiedergabekopf W3 über den Relaiskontakt
^3 an den Ausgang R angeschaltet. Relais
X3 hält sich selbst über die Haltewicklung, den
Ruhekontakt y3 und den Arbeitskontakt x3. Das
etwas verzögert ansprechende Relais Z legt nun sämtliche ^-Kontakte um, trennt damit alle
Z-Relais von den Bürsten ab und legt die F-Relais
an. F3 kann aber nicht ansprechen, weil mittlerweile der Kontaktstreifen K2 die Bürste 3 verlassen
hat. Die anderen Y-Relais können nicht ansprechen, weil ihre Λτ-Kontakte geöffnet sind. Es bleibt also
nun der Wiedergabekopf W3 beim Weiterlaufen des Bandes mit dem Ausgang R verbunden.
Nach einer Umdrehung gelangt der Kontaktstreifen K2 wieder zur Bürste 3. Damit erhält
Relais Y3 Strom über Pluspol, x3, Y3 z, Bürste 3,
K2, K1, Bürste o, Schalter S, Z, Minuspol. Die
Haltewicklung von X3 wird durch den Kontakt 3/3
geöffnet. Der Wiedergabekopf W3 wird vom Ausgang
R abgetrennt, die Haltewicklung des Z-Relais geöffnet, so daß die ganze Einrichtung wieder abfragebereit
in der Ausgangsstellung liegt.
Fig. 4 zeigt ein beispielsweises Schaltschema eines Abrufregisters zur Anordnung der Sprachlaute
in einer gewünschten Reihenfolge. Diese ist in der Lage, eine gewisse Anzahl von Kennzeichen
der Sprachlaute zu speichern. Als Kennzeichen der Sprachlaute können z. B. Dualsignale benutzt
werden. In bekannter Weise können die N Sprachlaute durch m = 2logiV Dualsignale dargestellt
werden, z. B. durch die Stellungen von je m Relais. Es ist in der Fig. 4 jeweils nur ein Pol der m Pole
aufgezeichnet, für die anderen Pole gilt das gleiche Schema.
Ta, Tb usw. sind Drucktasten, die den einzelnen
Sprachlauten zugeordnet sind. Jede Taste hat m Kontakte, die entsprechend dem Dualsignal beim
Drücken der Taste eingestellt werden. Einer dieser Kontakte ist in dem Bild dargestellt. Der Drehwähler
D1 wird nach jedem Tastendruck um einen Schritt weitergeschaltet.' Seine Ausgänge sind an
die Speicherrelais, in dem Beispiel vier Stück, angeschlossen, so daß diese der Reihe nach mit den
eingetasteten Dualsignalen gefüllt werden.
Der Abruf aus dem Speicher geschieht über den Drehwähler D2, der immer dann weitergeschaltet
wird, wenn der Lautspeicher weiterschaltet. Als Kennzeichen dafür kann z. B. der Abfall des
Z-Relais in Fig. 3 dienen. Im Übersetzer Ü werden die Dualsignale dazu benutzt, den zu dem betreffenden
Buchstaben gehörigen Schalter 5" (Fig. 3) zu schließen.
Im einzelnen können auch hier sowohl für die Speicherung als auch für die Ausführung der
Schaltvorgänge die bekannten Bauelemente der Wähler- und Vermittlungstechnik sowie der Technik
der elektronischen Rechenmaschinen verwendet werden.
Claims (8)
1. Einrichtung zur Wiedergabe von Sprachlauten, die'inAbhängigkeit von unter Frequenzbandeinengung
übertragenen Zeichen zu Worten zusammengefügt werden, dadurch gekennzeichnet, daß die den übertragenen Zeichen entsprechenden
Laute bzw. Lautverbindungen als fertige natürliche Laute bzw. Lautverbindun-
' gen aus Magnetton- oder Lichttonspeichern ent- *°5
nommen werden.
2. Einrichtung1 nach Anspruch 1, dadurch gekennzeichnet,
daß die Dauer dieser Sprachlaute auf eine Grundzeit oder ein ganzzahliges Vielfaches
dieser Grundzeit beschränkt ist. »0
3. Einrichtung nach Anspruch 1 und 2, dadurch
gekennzeichnet, daß an den Lautspeichern Wiedergabeköpfe in Abständen, die der Grundzeit entsprechen, gleichmäßig' angeordnet
sind.
4. Einrichtung nach Anspruch 1 und 2, dadurch gekennzeichnet, daß sich diese Lautspeicher
relativ zu den Wiedergabeköpfen bewegen und daß dies*1 Bewegung stetig verläuft.
5. Einrichtung nach Anspruch 1 bis 4, dadurch gekennzeichnet, daß jeweils derjenige
Wiedergabekopf mit dem Ausgang verbunden wird, der den Beginn des Sprachlautes erfaßt,
und daß die anderen Wiedergabeköpfe des gleichen Sprachlautes für die ganze Zeit der
Wiedergabe gesperrt bleiben.
6. Einrichtung nach Anspruch i, dadurch gekennzeichnet,
daß die Reihenfolge des Abrufes der Sprachlaute durch ein Register bestimmt wird, in das die Sprachlaute in der gewünschten
■ 5 Reihenfolge durch an sich bekannte Mittel eingespeichert
werden.
7. Einrichtung nach Anspruch i, dadurch gekennzeichnet,
daß jedem Sprachlaut ein duales Signal zur Kennzeichnung zugeordnet wird.
8. Einrichtung nach Anspruch i, 6 und 7, dadurch
gekennzeichnet, daß die Sprachlaute im Register durch ihre Dualsignale gekennzeichnet
werden.
In Betracht gezogene Druckschriften:
»Elektrotechnik«, März 1949, Nr. 3, S. 87 bis 89; »Funk und Ton«, 1950, Nr. 7, S. 376 bis 378.
»Elektrotechnik«, März 1949, Nr. 3, S. 87 bis 89; »Funk und Ton«, 1950, Nr. 7, S. 376 bis 378.
Hierzu 1 Blatt Zeichnungen
θ 609579/368 8.56 (609 797 2.57)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DEK18340A DE958305C (de) | 1953-06-07 | 1953-06-07 | Einrichtung zur Wiedergabe von Sprachlauten, die in Abhaengigkeit von unter Frequenzbandeinengung uebertragenen Zeichen zu Worten zusammengefuegt werden |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DEK18340A DE958305C (de) | 1953-06-07 | 1953-06-07 | Einrichtung zur Wiedergabe von Sprachlauten, die in Abhaengigkeit von unter Frequenzbandeinengung uebertragenen Zeichen zu Worten zusammengefuegt werden |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE958305C true DE958305C (de) | 1957-02-14 |
Family
ID=7215361
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DEK18340A Expired DE958305C (de) | 1953-06-07 | 1953-06-07 | Einrichtung zur Wiedergabe von Sprachlauten, die in Abhaengigkeit von unter Frequenzbandeinengung uebertragenen Zeichen zu Worten zusammengefuegt werden |
Country Status (1)
| Country | Link |
|---|---|
| DE (1) | DE958305C (de) |
-
1953
- 1953-06-07 DE DEK18340A patent/DE958305C/de not_active Expired
Non-Patent Citations (1)
| Title |
|---|
| None * |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE2159848A1 (de) | System zur abschnittweisen Unter teilung von Sprach und Digitalsignalen und zur Herstellung gedruckter Texte | |
| DE2237594A1 (de) | Elektronische musikinstrumente, die gespeicherte wellenformen zur tonerzeugung und -steuerung abtasten | |
| DE3321842A1 (de) | Adressanzeigeeinrichtung, insbesondere fuer plattenspieler | |
| DE2836736C3 (de) | Verfahren zur Aufzeichnung von beim Spielen eines tastenbetätigten Musikinstruments entstehenden Tonsignalen und den damit verbundenen Spielausdrücken, insbesondere der Lautstärke, entsprechenden Datensignalfolgen auf einem Aufzeichnungsträger und Vorrichtung zur Durchführung des Verfahrens | |
| DE958305C (de) | Einrichtung zur Wiedergabe von Sprachlauten, die in Abhaengigkeit von unter Frequenzbandeinengung uebertragenen Zeichen zu Worten zusammengefuegt werden | |
| DE2819271A1 (de) | Schaltung zur steuerung des ausdrucks eines elektronisch gesteuerten tastaturinstruments | |
| DE2836737C3 (de) | Verfahren zur Aufzeichnung von beim Spielen eines tastenbetätigten Musikinstruments entstehenden Tonsignalen entsprechenden Datensignalfolgen auf einem Aufzeichnungsträger | |
| DE3229634A1 (de) | Bildschirm - spielautomat | |
| DE1538375B2 (de) | Steuereinrichtung | |
| DE2329955A1 (de) | Automatisierte audio-frage- und berichteinrichtung | |
| DE2412382A1 (de) | Verfahren zur speicherung von analogen signalen, insbesondere von sprache, und nach diesem verfahren hergestellter signalgeber | |
| DE3100934A1 (de) | Verfahren zur erzeugung einer seriellen tastenimpulsinformation mit einer ersten abtastwiederholfrequenz in abhaengigkeit von einer asynchron mit einer zweiten abtastwiederholfrequenz erzeugten seriellen multiplex-tasten-impulsformation sowie schnittstelleneinrichtung zur durchfuehrung des verfahrens | |
| DE1138557B (de) | Verfahren un Vorrichtung zur selektiven Wiedergabeund Aufzeichnung bestimmter Abschnitte. | |
| DE1185829B (de) | Verfahren und Einrichtung zum zeitlich und raeumlich verzoegerten Aufzeichnen von physikalischen Zustaenden in einem Tiefbohrloch | |
| DEK0018340MA (de) | ||
| DE2551908A1 (de) | Magnetbandkassetten-aggregat | |
| DE2440420C3 (de) | Einrichtung zur Erzeugung eines automatischen Baßlaufs als Begleitung zu einem auf einem elektronischen Musikinstrument gespielten Musikstück | |
| EP0045502A2 (de) | Metronom mit optischer und/oder akustischer Signalgabe | |
| DE2659830C2 (de) | Vorrichtung zur Übertragung eines Strickmusters auf einen Programmträger für eine Handstrickmaschine | |
| DE3222604A1 (de) | Verfahren zur uebermittlung mehrerer informationsarten ueber einen fernsehkanal und einrichtung zur ausfuehrung derselben | |
| DE2819270A1 (de) | Dynamisch anpassbares uormatbildungssystem von einer rolle eines elektrischen klaviers auf ein magnetband und playback | |
| EP0094681B1 (de) | Schaltungsanordnung zur elektronischen Sprachsynthese | |
| DE2830297A1 (de) | Frequenz- signal- steuerungsgeraet fuer reiz- reaktions-messgeraete mit speicherbaren programmen | |
| DE1547026A1 (de) | Verfahren zur Spracherkennung fuer mehrere Eingangskanaele | |
| DE391550C (de) | Optophonische Vorrichtung zum Vorlesen von Schriftzeichen |