[go: up one dir, main page]

DE958305C - Einrichtung zur Wiedergabe von Sprachlauten, die in Abhaengigkeit von unter Frequenzbandeinengung uebertragenen Zeichen zu Worten zusammengefuegt werden - Google Patents

Einrichtung zur Wiedergabe von Sprachlauten, die in Abhaengigkeit von unter Frequenzbandeinengung uebertragenen Zeichen zu Worten zusammengefuegt werden

Info

Publication number
DE958305C
DE958305C DEK18340A DEK0018340A DE958305C DE 958305 C DE958305 C DE 958305C DE K18340 A DEK18340 A DE K18340A DE K0018340 A DEK0018340 A DE K0018340A DE 958305 C DE958305 C DE 958305C
Authority
DE
Germany
Prior art keywords
sound
speech
sounds
speech sounds
playback
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DEK18340A
Other languages
English (en)
Inventor
Dr-Ing E H Karl Kuepfmueller
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
E H KARL KUEPFMUELLER DR ING
Original Assignee
E H KARL KUEPFMUELLER DR ING
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by E H KARL KUEPFMUELLER DR ING filed Critical E H KARL KUEPFMUELLER DR ING
Priority to DEK18340A priority Critical patent/DE958305C/de
Application granted granted Critical
Publication of DE958305C publication Critical patent/DE958305C/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Description

Die Erfindung bezieht sich auf eine Einrichtung zur Wiedergabe von Sprache, bei der für die Übertragung der Sprache eine gegenüber der Originalbandbreite wesentlich geringere Bandbreite beansprucht wird.
Es sind bereits derartige Nachrichtenübertragungseinrichtungen bekanntgeworden. Ihr Zweck ist es, die Nachrichtenkapazität von hochwertigen Übertragungswegen ungeachtet des höheren Endstellenaufwandes möglichst gut auszunützen.
So ist z. B. ein Verfahren bekannt, bei dem ein Sprachband von 250 bis 7100 Hz auf ein schmales Band von 360 Hz Breite gebracht wird. Dabei gelangt man über die Sprachanalyse auf die Sprachsynthese, d. h. auf die Erzeugung künstlicher Sprache. Die menschliche Sprache enthält »feste« und »veränderliche« Bestandteile. Die festen Bestandteile werden am Wiedergabeort von festen Oszillatoren geliefert. Die veränderlichen Bestandteile werden übertragen. Die festen Oszillatoren (Generatoren) werden durch ebenfalls übertragene Kennzeichen gesteuert.
Eine Möglichkeit der Sprachsynthese besteht auch darin, die Sprachlaute auf optischem Wege durch Frequenz und zeitlichen Verlauf darzustellen und das Diagramm, das die Laute in vereinfachter Weise schematisch repräsentiert,, zur Wiedergabe optisch abzutasten und zu Worten zusammenzusetzen. Dieses Verfahren verlangt jedoch, daß die Nachricht selbst zur Aufzeichnung vorliegt und
das Ergebnis der erforderlichen Analyse in einem Frequenz-Zeit-Diagramm dargestellt wird, das indessen auch noch bei erheblichen Vereinfachungen eine brauchbare Wiedergabe des in dem Diagramm festgehaltenen Nachrichteninhalts ermöglicht. Diese Vereinfachung der Aufzeichnung erfordert für eine Übertragung einen entsprechend geringeren Aufwand an Bandweite. Man kann eine noch wesentlich weitergehendere Einengung des für einen
ίο Kanal benötigten Frequenzbandes erreichen, indem bei einer Einrichtung zur Wiedergabe von Sprachlauten, die in Abhängigkeit von unter Frequenzbandeinengung übertragenen Zeichen zu Worten zusammengefügt werden, erfindungsgemäß die den übertragenen Zeichen entsprechenden Laute bzw. Lautverbindungen als fertige natürliche Laute bzw. Lautverbindungen aus Magnetton- oder Lichttonspeichern entnommen werden.
Man fügt dabei die Laute zur Wiedergabe von Nachrichten in beliebiger Weise in der richtigen zeitlichen Reihenfolge zu Wörtern und Sätzen zusammen.
Dieses Verfahren hat für die elektrische Übertragung von Sprache den Vorteil, daß die Übertragung mit einem Minimum an Nachrichtenkapazität durchgeführt werden kann. Rechnet man z. B. mit N gespeicherten Sprachlauten (einschließlich der verschiedenen Tonhöhen, Lautstärken, Klangfarben und Lautverbindungen), so sind zur Auswahl eines Sprachlautes jeweils m = 2 log ΛΓ Nachrichteneinheiten (Zweierschritte oder Telegraphierimpulse) erforderlich. Sollen η Sprachlaute oder Lautverbindungen je Zeiteinheit übertragen werden, dann ist die erforderliche Nachrichtenkapazität des Übertragungskanals
C = n2log N Nachrichteneinheiten. Zum Beispiel für N = 500 und η = iooo jeMinute
C = 150 Nachrichteneinheiten je Sekunde.
Diese Nachrichtenkapazität erfordert bei Impulsübertragung mit einem Störverhältnis, das kleiner als V2 ist, ein Frequenzband von der Breite 75 Hz gegenüber mindestens 3000 Hz und einem Störverhältnis von höchstens einem Fünfzigstel bei gewöhnlicher Sprachübertragung.
Die Erfindung wird nun an Hand der Fig. 1 bis 4 und eines speziellen Ausführungsbeispiels eingehend beschrieben.
So Fig. ι zeigt als Beispiel den natürlichen Zeitverlauf des Wortes »aber«;
Fig. 2 zeigt vier Speicherbahnen für die »normierten Sprachlaute« des Wortes »aber«, die zugehörigen Wiedergabeköpfe und die Abfrageschalter;
Fig. 3 zeigt eine beispielsweise Anordnung des Abfragemechanismus, bei dem nur Relais verwendet werden;
Fig. 4 zeigt eine Speicheranordnung für Dualsignale.
In Fig. ι ist nun an Hand des als Beispiel gewählten Wortes »aber« in einem Diagramm der etwa natürliche zeitliche Ablauf dieses Wortes für einen willkürlich herausgegriffenen Fall dargestellt. Da nun die Sprachlaute zu ganz bestimmten Zeitpunkten entnommen werden müssen, damit sie zur Bildung der Wörter ohne Lücken oder Überlappungen zusammenschließen, erweist es sich als notwendig, dabei eine Vereinfachung einzuführen.
Die Dauer des Wortes »aber« ist in dem gewählten Beispiel 1060 ms = i,o6 see. Soll das Wort in einem bestimmten Zeitpunkt beginnen, dann muß dieser Zeitpunkt mit dem Beginn des aus dem Lautspeicher zu entnehmenden Vokals a zusammenfallen. Nach Beendigung des Vokals a, 520 ms später, muß das b einsetzen. Die Aufgabe könnte im Prinzip dadurch gelöst werden, daß die erwähnten, mechanisch angetriebenen Speicher immer im erforderlichen Zeitpunkt an einen ständig laufenden Motor angekuppelt werden. Dies stellt jedoch technisch schwierige Zeitbedingungen für die Kupplung. Gemäß einer weiteren Ausbildung der Erfindung werden mechanische Kupplungen dieser Art völlig vermieden, so daß die Lautspeicher ständig gleichmäßig laufen können. Zu diesem Zweck werden Sprachlaute und Lautverbindungen erstens in ihrer Dauer als ganzzahlige Vielfache einer Gfundzeitspanne gewählt, und zweitens in Zeitabständen, die gleich dieser Grundzeit sind, abgetastet.
Die Grundzeit kann z. B. zu 50 ms gewählt werden. Dann soll die Zeitdauer aller anderen Laute entweder gleich 50 ms oder ein ganzzahliges Vielfaches davon sein. So kann z. B. ein »a« zu 400 ms Zeitdauer gewählt werden. Dieser Laut kann auf ein Band von z. B. 320 mm Länge aufgezeichnet sein, das den Umfang einer mit 2,5 Umdrehungen je Sekunde rotierenden Trommel bildet. In Abständen von 40 mm (entsprechend 5°ms) längs des Umfanges sind Wiedergabeköpfe angeordnet, in dem Beispiel 8 Stück. Der Vokal »a« beginnt also in jedem Wiedergabekopf um 50 ms später als im vorhergehenden. Auf diese Weise ergibt sich die Möglichkeit, die Sprachlaute durch ■einfaches Umschalten zwischen den entsprechenden Wiedergabeköpfen aneinanderzureihen.
Fig. 2 zeigt schematisch die vier Speicherbahnen für vier willkürlich herausgegriffene Sprachlaute, wobei das »a« 400 ms, das- »b« 5° ms, das »e« 200 ms und das »r« 200 ms für einen Umlauf brauche. Alle diese Zeitspannen sind ganzzahlige Vielfache der Grundzeit von 50 ms. Dementsprechend finden sich am Umfang der Speicherbänder beim »a« acht Wiedergabeköpfe, die mit 1 bis 8 bezeichnet sind, beim »b« ein Wiedergabekopf, beim »e« und »r« je vier Wiedergabeköpfe. Die Wiedergabeköpfe stehen über Schalter mit den elektrischen Ausgängen A, B, E, R in Verbindung. Diese Schalter verbinden jeweils denjenigen Wiedergabekopf mit dem Ausgang, der den Beginn des iao Sprachlautes aufnimmt. Soll nun ein Sprachlaut am Ausgang entnommen werden, dann wird der betreffende Schalter für eine Umdrehung des Lautspeichers stillgesetzt.
Es handle sich z. B. um die Wiedergabe des Wortes »aber«. Der Schalter für »a«, der synchron
mit dem Tonband »a« umläuft, befinde sich beim Beginn des Wortes gerade auf dem Wiedergabekopf 3. Nach Ablauf des Sprachlautes wird auf das »b« umgeschaltet, nach Ablauf des »b« auf S das »e«. Dort befinde sich der Schalter z. B. auf Stellung 2. Er wird stillgehalten, bis das »e« abgelaufen ist; dann wird auf »r« übergeschaltet, wo sich der Drehschalter ebenfalls gerade auf 2 befindet. Die vier. Sprachlaute können also auf diese Weise lückenlos aneinandergereiht werden.
Der Schaltermechanismus kann unter Benutzung der bekannten technischen Hilfsmittel der Wählerund Schaltertechnik in verschiedener Weise ausgeführt werden.
Fig. 3 zeigt ein Beispiel, bei dem nur Relais verwendet werden. Die Anordnung ist so getroffen, daß die Relais nur dann arbeiten, wenn der Spracblaut angefordert wird, so daß der Schaltermechanismus nicht unnötig beansprucht wird.
M ist d?.s abgewickelte Magnettonband, z. B. für den Laut »r«, K1, K2 sind Kontaktstreifen, auf denen die Bürsten o, 1, 2, 3, 4 schleifen. In der Abwicklung bewegen sich die Bänder von rechts nach links, wie es der Pfeil angibt.
Der Anfang des Sprachlautes befinde sich in der gezeichneten Stellung vor dem Wiedergabekopf W3. Der Kontaktstreifen K2 stellt die Verbindung zwischen Bürste ο und Bürste 3 her. Der Sprachlaut kann durch die Taste 6" angefordert werden. Wird diese Taste nicht gedrückt, dann sind die Stromkreise sämtlicher Relaiswicklungen offen, so daß keines der Relais betätigt wird. Schließt man den Schalter S, dann spricht zunächst Relais X3 an, über Pluspol, Wicklung X3, Relaiskontakt 2, Bürste 3, Kontaktstreifen K2, Kontaktstreifen K1, Bürste o, Schalter S, Wicklung Z, Minuspol. Damit wird der Wiedergabekopf W3 über den Relaiskontakt ^3 an den Ausgang R angeschaltet. Relais X3 hält sich selbst über die Haltewicklung, den
Ruhekontakt y3 und den Arbeitskontakt x3. Das etwas verzögert ansprechende Relais Z legt nun sämtliche ^-Kontakte um, trennt damit alle Z-Relais von den Bürsten ab und legt die F-Relais an. F3 kann aber nicht ansprechen, weil mittlerweile der Kontaktstreifen K2 die Bürste 3 verlassen hat. Die anderen Y-Relais können nicht ansprechen, weil ihre Λτ-Kontakte geöffnet sind. Es bleibt also nun der Wiedergabekopf W3 beim Weiterlaufen des Bandes mit dem Ausgang R verbunden.
Nach einer Umdrehung gelangt der Kontaktstreifen K2 wieder zur Bürste 3. Damit erhält Relais Y3 Strom über Pluspol, x3, Y3 z, Bürste 3, K2, K1, Bürste o, Schalter S, Z, Minuspol. Die Haltewicklung von X3 wird durch den Kontakt 3/3 geöffnet. Der Wiedergabekopf W3 wird vom Ausgang R abgetrennt, die Haltewicklung des Z-Relais geöffnet, so daß die ganze Einrichtung wieder abfragebereit in der Ausgangsstellung liegt.
Fig. 4 zeigt ein beispielsweises Schaltschema eines Abrufregisters zur Anordnung der Sprachlaute in einer gewünschten Reihenfolge. Diese ist in der Lage, eine gewisse Anzahl von Kennzeichen der Sprachlaute zu speichern. Als Kennzeichen der Sprachlaute können z. B. Dualsignale benutzt werden. In bekannter Weise können die N Sprachlaute durch m = 2logiV Dualsignale dargestellt werden, z. B. durch die Stellungen von je m Relais. Es ist in der Fig. 4 jeweils nur ein Pol der m Pole aufgezeichnet, für die anderen Pole gilt das gleiche Schema.
Ta, Tb usw. sind Drucktasten, die den einzelnen Sprachlauten zugeordnet sind. Jede Taste hat m Kontakte, die entsprechend dem Dualsignal beim Drücken der Taste eingestellt werden. Einer dieser Kontakte ist in dem Bild dargestellt. Der Drehwähler D1 wird nach jedem Tastendruck um einen Schritt weitergeschaltet.' Seine Ausgänge sind an die Speicherrelais, in dem Beispiel vier Stück, angeschlossen, so daß diese der Reihe nach mit den eingetasteten Dualsignalen gefüllt werden.
Der Abruf aus dem Speicher geschieht über den Drehwähler D2, der immer dann weitergeschaltet wird, wenn der Lautspeicher weiterschaltet. Als Kennzeichen dafür kann z. B. der Abfall des Z-Relais in Fig. 3 dienen. Im Übersetzer Ü werden die Dualsignale dazu benutzt, den zu dem betreffenden Buchstaben gehörigen Schalter 5" (Fig. 3) zu schließen.
Im einzelnen können auch hier sowohl für die Speicherung als auch für die Ausführung der Schaltvorgänge die bekannten Bauelemente der Wähler- und Vermittlungstechnik sowie der Technik der elektronischen Rechenmaschinen verwendet werden.

Claims (8)

PATENTANSPRÜCHE:
1. Einrichtung zur Wiedergabe von Sprachlauten, die'inAbhängigkeit von unter Frequenzbandeinengung übertragenen Zeichen zu Worten zusammengefügt werden, dadurch gekennzeichnet, daß die den übertragenen Zeichen entsprechenden Laute bzw. Lautverbindungen als fertige natürliche Laute bzw. Lautverbindun-
' gen aus Magnetton- oder Lichttonspeichern ent- *°5 nommen werden.
2. Einrichtung1 nach Anspruch 1, dadurch gekennzeichnet, daß die Dauer dieser Sprachlaute auf eine Grundzeit oder ein ganzzahliges Vielfaches dieser Grundzeit beschränkt ist. »0
3. Einrichtung nach Anspruch 1 und 2, dadurch gekennzeichnet, daß an den Lautspeichern Wiedergabeköpfe in Abständen, die der Grundzeit entsprechen, gleichmäßig' angeordnet sind.
4. Einrichtung nach Anspruch 1 und 2, dadurch gekennzeichnet, daß sich diese Lautspeicher relativ zu den Wiedergabeköpfen bewegen und daß dies*1 Bewegung stetig verläuft.
5. Einrichtung nach Anspruch 1 bis 4, dadurch gekennzeichnet, daß jeweils derjenige Wiedergabekopf mit dem Ausgang verbunden wird, der den Beginn des Sprachlautes erfaßt, und daß die anderen Wiedergabeköpfe des gleichen Sprachlautes für die ganze Zeit der Wiedergabe gesperrt bleiben.
6. Einrichtung nach Anspruch i, dadurch gekennzeichnet, daß die Reihenfolge des Abrufes der Sprachlaute durch ein Register bestimmt wird, in das die Sprachlaute in der gewünschten
■ 5 Reihenfolge durch an sich bekannte Mittel eingespeichert werden.
7. Einrichtung nach Anspruch i, dadurch gekennzeichnet, daß jedem Sprachlaut ein duales Signal zur Kennzeichnung zugeordnet wird.
8. Einrichtung nach Anspruch i, 6 und 7, dadurch gekennzeichnet, daß die Sprachlaute im Register durch ihre Dualsignale gekennzeichnet werden.
In Betracht gezogene Druckschriften:
»Elektrotechnik«, März 1949, Nr. 3, S. 87 bis 89; »Funk und Ton«, 1950, Nr. 7, S. 376 bis 378.
Hierzu 1 Blatt Zeichnungen
θ 609579/368 8.56 (609 797 2.57)
DEK18340A 1953-06-07 1953-06-07 Einrichtung zur Wiedergabe von Sprachlauten, die in Abhaengigkeit von unter Frequenzbandeinengung uebertragenen Zeichen zu Worten zusammengefuegt werden Expired DE958305C (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DEK18340A DE958305C (de) 1953-06-07 1953-06-07 Einrichtung zur Wiedergabe von Sprachlauten, die in Abhaengigkeit von unter Frequenzbandeinengung uebertragenen Zeichen zu Worten zusammengefuegt werden

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DEK18340A DE958305C (de) 1953-06-07 1953-06-07 Einrichtung zur Wiedergabe von Sprachlauten, die in Abhaengigkeit von unter Frequenzbandeinengung uebertragenen Zeichen zu Worten zusammengefuegt werden

Publications (1)

Publication Number Publication Date
DE958305C true DE958305C (de) 1957-02-14

Family

ID=7215361

Family Applications (1)

Application Number Title Priority Date Filing Date
DEK18340A Expired DE958305C (de) 1953-06-07 1953-06-07 Einrichtung zur Wiedergabe von Sprachlauten, die in Abhaengigkeit von unter Frequenzbandeinengung uebertragenen Zeichen zu Worten zusammengefuegt werden

Country Status (1)

Country Link
DE (1) DE958305C (de)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
None *

Similar Documents

Publication Publication Date Title
DE2159848A1 (de) System zur abschnittweisen Unter teilung von Sprach und Digitalsignalen und zur Herstellung gedruckter Texte
DE2237594A1 (de) Elektronische musikinstrumente, die gespeicherte wellenformen zur tonerzeugung und -steuerung abtasten
DE3321842A1 (de) Adressanzeigeeinrichtung, insbesondere fuer plattenspieler
DE2836736C3 (de) Verfahren zur Aufzeichnung von beim Spielen eines tastenbetätigten Musikinstruments entstehenden Tonsignalen und den damit verbundenen Spielausdrücken, insbesondere der Lautstärke, entsprechenden Datensignalfolgen auf einem Aufzeichnungsträger und Vorrichtung zur Durchführung des Verfahrens
DE958305C (de) Einrichtung zur Wiedergabe von Sprachlauten, die in Abhaengigkeit von unter Frequenzbandeinengung uebertragenen Zeichen zu Worten zusammengefuegt werden
DE2819271A1 (de) Schaltung zur steuerung des ausdrucks eines elektronisch gesteuerten tastaturinstruments
DE2836737C3 (de) Verfahren zur Aufzeichnung von beim Spielen eines tastenbetätigten Musikinstruments entstehenden Tonsignalen entsprechenden Datensignalfolgen auf einem Aufzeichnungsträger
DE3229634A1 (de) Bildschirm - spielautomat
DE1538375B2 (de) Steuereinrichtung
DE2329955A1 (de) Automatisierte audio-frage- und berichteinrichtung
DE2412382A1 (de) Verfahren zur speicherung von analogen signalen, insbesondere von sprache, und nach diesem verfahren hergestellter signalgeber
DE3100934A1 (de) Verfahren zur erzeugung einer seriellen tastenimpulsinformation mit einer ersten abtastwiederholfrequenz in abhaengigkeit von einer asynchron mit einer zweiten abtastwiederholfrequenz erzeugten seriellen multiplex-tasten-impulsformation sowie schnittstelleneinrichtung zur durchfuehrung des verfahrens
DE1138557B (de) Verfahren un Vorrichtung zur selektiven Wiedergabeund Aufzeichnung bestimmter Abschnitte.
DE1185829B (de) Verfahren und Einrichtung zum zeitlich und raeumlich verzoegerten Aufzeichnen von physikalischen Zustaenden in einem Tiefbohrloch
DEK0018340MA (de)
DE2551908A1 (de) Magnetbandkassetten-aggregat
DE2440420C3 (de) Einrichtung zur Erzeugung eines automatischen Baßlaufs als Begleitung zu einem auf einem elektronischen Musikinstrument gespielten Musikstück
EP0045502A2 (de) Metronom mit optischer und/oder akustischer Signalgabe
DE2659830C2 (de) Vorrichtung zur Übertragung eines Strickmusters auf einen Programmträger für eine Handstrickmaschine
DE3222604A1 (de) Verfahren zur uebermittlung mehrerer informationsarten ueber einen fernsehkanal und einrichtung zur ausfuehrung derselben
DE2819270A1 (de) Dynamisch anpassbares uormatbildungssystem von einer rolle eines elektrischen klaviers auf ein magnetband und playback
EP0094681B1 (de) Schaltungsanordnung zur elektronischen Sprachsynthese
DE2830297A1 (de) Frequenz- signal- steuerungsgeraet fuer reiz- reaktions-messgeraete mit speicherbaren programmen
DE1547026A1 (de) Verfahren zur Spracherkennung fuer mehrere Eingangskanaele
DE391550C (de) Optophonische Vorrichtung zum Vorlesen von Schriftzeichen