DE1219093B - Method and arrangement for generating artificial speech from digital data on speech stored in an electronic data processing system - Google Patents
Method and arrangement for generating artificial speech from digital data on speech stored in an electronic data processing systemInfo
- Publication number
- DE1219093B DE1219093B DEJ25600A DEJ0025600A DE1219093B DE 1219093 B DE1219093 B DE 1219093B DE J25600 A DEJ25600 A DE J25600A DE J0025600 A DEJ0025600 A DE J0025600A DE 1219093 B DE1219093 B DE 1219093B
- Authority
- DE
- Germany
- Prior art keywords
- digital
- switch
- processing system
- data processing
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Circuit For Audible Band Transducer (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Arrangements For Transmission Of Measured Signals (AREA)
- Analogue/Digital Conversion (AREA)
- Time-Division Multiplex Systems (AREA)
Abstract
Description
BUNDESREPUBLIK DEUTSCHLANDFEDERAL REPUBLIC OF GERMANY
DEUTSCHESGERMAN
PATENTAMTPATENT OFFICE
AUSLEGESCHRIFTEDITORIAL
Int. Cl.:Int. Cl .:
H04bH04b
H04mH04m
Nummer:
Aktenzeichen:
Anmeldetag:
Auslegetag:Number:
File number:
Registration date:
Display day:
J 25600 VIII a/21 a2J 25600 VIII a / 21 a2
6. April 1964April 6, 1964
16. Juni 1966June 16, 1966
Es ist eine Reihe von Verfahren zur Erzeugung künstlicher Sprache bekanntgeworden, die sich sowohl mechanischer und elektromechanischer als auch rein elektronischer Mittel bedient. Für Ausgabegeräte für elektronische Datenverarbeitungsanlagen sind diese Verfahren jedoch weniger geeignet.A number of methods for generating artificial speech have become known which are both mechanical and electromechanical as well as purely electronic means. For output devices however, these methods are less suitable for electronic data processing systems.
Es ist daher die Aufgabe der Erfindung, ein Verfahren zur Erzeugung künstlicher Sprache anzugeben, welches besonders für die Datenausgabe in gesprochener Form aus datenverarbeitenden Anlagen geeignet ist.It is therefore the object of the invention to specify a method for generating artificial speech, which especially for the data output in spoken form from data processing systems suitable is.
Die Erfindung betrifft demnach ein Verfahren zur Erzeugung künstlicher Sprache aus in einer elektronischen Datenverarbeitungsanlage gespeicherten digitalen Daten über die momentane Energie in η Frequenzteilbereichen des zu erzeugenden Sprachsignals (Kanalenergiewerte) sowie über den zeitlichen Verlauf der Energieanregung des Sprachsignals, wobei die Anregung des Sprachsignals durch in ihrer zeitlichen Lage definierte Energieimpulse erfolgt. Gekennzeichnet ist dieses Verfahren dadurch, daß von der Datenverarbeitungsanlage jeweils zu den durch die zeitliche Lage der zu erzeugenden Anregungsenergieimpulse gegebenen Zeitpunkten η die Kanalenergiewerte darstellende digitale Codegruppen nacheinander auf einen Schalter gegeben werden, welcher je eine Codegruppe auf den zugeordneten Kanal der Kanäle 1 bis η verteilt, daß in jedem Kanal ein Digital-Analog-Wandler aus der Codegruppe einen amplitudenmodulierten Impuls herstellt und daß von diesem Impuls in einem jeweils nachgeschalteten Bandfilter nur die Frequenzen des entsprechenden Bandes durchgelassen werden, derart, daß die Summe der Filterausgangsspannungen ein elektrisches Sprachsignal ergibt.The invention accordingly relates to a method for generating artificial speech from digital data stored in an electronic data processing system about the current energy in η frequency subranges of the speech signal to be generated (channel energy values) and about the time course of the energy excitation of the speech signal, the excitation of the speech signal being triggered by in their energy impulses defined at the time. This method is characterized by the fact that the data processing system sends digital code groups representing the channel energy values to a switch one after the other at the times η given by the temporal position of the excitation energy pulses to be generated, each of which distributes a code group to the assigned channel of channels 1 to η that in each channel a digital-to-analog converter produces an amplitude-modulated pulse from the code group and that only the frequencies of the corresponding band are allowed to pass through this pulse in a subsequent band filter, so that the sum of the filter output voltages results in an electrical speech signal.
Eine Anordnung zur Durchführung dieses Verfahrens kann in besonders günstiger Weise dadurch verwirklicht werden, daß die aus η Codegruppen bestehenden Daten von der Datenverarbeitungsanlage in Form eines /c-stelligen Code als Impulse über k parallele Leitungen und über einen Schalter mit /c Armen zu dem Digital-Analog-Wandler des jeweils zugeordneten Kanals übertragen werden und dieser Wandler nur passive und näherungsweise lineare Schaltelemente zur Umwandlung der Codegruppe in einen amplitudenmodulierten Impuls enthält.An arrangement for carrying out this method can be implemented in a particularly advantageous manner that the data consisting of η code groups from the data processing system in the form of a / c-digit code as pulses via k parallel lines and via a switch with / c arms to the digital -Analog converters of the respectively assigned channel are transmitted and this converter contains only passive and approximately linear switching elements for converting the code group into an amplitude-modulated pulse.
Eine schaltungstechnische Vereinfachung der Anordnung läßt sich dadurch erzielen, daß vor dem Schalter ein einziger Digital-Analog-Wandler eingefügt wird, während die Wandler in den einzelnen Kanälen entfallen.A circuit simplification of the arrangement can be achieved that before Switch a single digital-to-analog converter is inserted while the converter is in each Channels are omitted.
Zur besseren Anpassung der Arbeitsgeschwindig-Verfahren
und Anordnung zur Erzeugung
künstlicher Sprache aus in einer elektronischen
Datenverarbeitungsanlage gespeicherten
digitalen Daten über die SpracheFor better adaptation of the working speed method and arrangement for generation
artificial speech from in an electronic
Data processing system stored
digital data on voice
Anmelder:Applicant:
IBM Deutschland Internationale Büro-MaschinenIBM Germany International Office Machines
Gesellschaft m. b. H.,Society m. B. H.,
Sindelfingen (Württ), Tübinger Allee 49Sindelfingen (Württ), Tübinger Allee 49
Als Erfinder benannt:
Dipl.-Ing. Dr. Kurt Bandat,
Dipl.-Ing. Ernst Rothauser, WienNamed as inventor:
Dipl.-Ing. Dr. Kurt Bandat,
Dipl.-Ing. Ernst Rothauser, Vienna
keiten der einzelnen Anlagen ist es weiterhin sehr vorteilhaft, zwischen die Datenverarbeitungsanlage und den Schatler bzw. den Digital-Analog-Wandler einen zusätzlichen Pufferspeicher einzuschalten, der die Daten aus der Anlage aufnimmt und zu von den Daten selbst gesteuerten Zeitpunkten mit gegebenenfalls transformierter Impulsfolgefrequenz an den Schalter bzw. den Digital-Analog-Wandler weiterleitet. It is also very advantageous between the data processing system and to switch on the Schatler or the digital-to-analog converter an additional buffer memory, the records the data from the system and, if necessary, at times controlled by the data itself forwards transformed pulse repetition frequency to the switch or the digital-to-analog converter.
Ferner ist es zur besseren Ausnutzung der Kapazität der Datenverarbeitungsanlage vorteilhaft, an
diese mehrere Sprechkanäle anzuschalten.
Gemäß einer weiteren Ausgestaltung der Erfindung wird vorgeschlagen, das elektrische Ausgangssprachsignal
nicht unmittelbar in akustische Sprachlaute umzuwandeln, sondern zunächst auf eine. Übertragungsleitung,
vorzugsweise eine Telefonleitung, zu übertragen und somit eine Datenausgabe aus einer
Datenverarbeitungsanlage in gesprochener Form auf eine Fernübertragungsleitung zu ermöglichen.Furthermore, for better utilization of the capacity of the data processing system, it is advantageous to connect several speech channels to it.
According to a further embodiment of the invention, it is proposed not to convert the electrical output speech signal directly into acoustic speech sounds, but first to one. Transmission line, preferably a telephone line, to transmit and thus enable data output from a data processing system in spoken form on a long-distance transmission line.
Im folgenden wird die Erfindung an Hand eines durch Zeichnungen erläuterten Ausführungsbeispieles näher beschrieben. Es zeigtIn the following the invention will be explained with reference to an embodiment illustrated by drawings described in more detail. It shows
F i g. 1 ein Blockschaltbild einer Anordnung zur Erzeugung künstlicher Sprache aus in einer Datenverarbeitungsanlage gespeicherten digitalen Daten,F i g. 1 is a block diagram of an arrangement for generating artificial speech in a data processing system stored digital data,
F,i g. 2 ein Blockschaltbild einer vereinfachten Anordnung zur Erzeugung künstlicher Sprache,F, i g. 2 is a block diagram of a simplified arrangement for generating artificial speech,
F i g. 3 ein Zeitdiagramm zur Veranschaulichung der Abtastvorgänge des Schalters S der F i g. 1 und 2 undF i g. 3 is a timing diagram to illustrate the scanning operations of the switch S of FIG. 1 and 2 and
609 579/275609 579/275
F i g. 4 die Verwendung eines Pufferspeichers zur Geschwindigkeitsanpassung des Schalters S der Fig. 1 und 2.F i g. 4 shows the use of a buffer memory for adapting the speed of the switch S of FIGS. 1 and 2.
In Fi g. 1 ist das Blockschaltbild einer Anordnung zur Durchführung des Verfahrens zur Erzeugung künstlicher Sprache aus in einer Datenverarbeitungsanlage EDV gespeicherten digitalen Daten der Sprache dargestellt. Am Ausgang der Datenverarbeitungsanlage EDV werden die digitalisierten Angaben über die Sprache, die sogenannten Daten, in Form eines fc-stelligen Code an k parallelen Leitungen zur Umwandlung in Sprache bereitgestellt. Die Enden dieser Leitungen sind mit einem Schalter S verbunden, der k parallele Durchschaltstrecken besitzt und somit jeweils eine komplette Codegruppe auf einen der Kanäle 1 bis η durchschalten kann. Zur Erläuterung der Abtastvorgänge ist es zweckmäßig, sich den Schalter 5 als einen mit k parallelen Armen versehenen Drehschalter, beispielsweise in der Art eines Drehwählers, vorzustellen, der innerhalb eines bestimmten Zeitintervalls nacheinander alle Kanäle von 1 bis η je einmal überstreicht. Die Kanäle 1 bis η entsprechen den Spektrumkanälen des nach dem bekannten Vocoder-Verfahren aufgespaltenen Sprachbandes. In Fi g. 1 shows the block diagram of an arrangement for carrying out the method for generating artificial speech from digital speech data stored in a data processing system EDP. At the output of the data processing system EDP , the digitized information about the language, the so-called data, is provided in the form of an fc-digit code on k parallel lines for conversion into language. The ends of these lines are connected to a switch S , which has k parallel through-connection paths and can thus in each case switch through a complete code group to one of the channels 1 to η . To explain the scanning processes, it is useful to think of the switch 5 as a rotary switch provided with k parallel arms, for example in the form of a rotary selector, which sweeps over all channels from 1 to η one after the other within a certain time interval. The channels 1 to η correspond to the spectrum channels of the voice band split according to the known vocoder method.
Die für die Anwendung des Vocoder-Verfahrens ebenfalls noch erforderliche Grundwelleninformation, die sogenannte Anregungsfunktion, mit der Frequenz fA wird' in bekannter Weise dadurch gewonnen, daß die Nulldurchgänge einer Richtung festgestellt werden und daraus jeweils ein Rechteckimpulszug abgeleitet wird. Der zeitliche Abstand der so gewonnenen Rechteckimpulse hat die Größe VfA, wie in Fig. 3 oben dargestellt ist. Die Drehgeschwindigkeit ω des Schalters S wird nun, wie aus Fi g. 3 unten ersichtlich ist, so gewählt, daß alle η Kanäle nacheinander im Zeitabstand Si/ω in der Zeit l/fA einmal abgetastet werden. Die jeweiligen Ausgangsgrößen bei der Abtastung eines Kanals werden über k parallele Leitungen einem jedem Kanal zugeordneten Digital-Analog-Wandler Z>v4 PF zugeführt, der einen dem im &-stelligen Code dargestellten Wert entsprechenden amplitudenmodulierten Impuls erzeugt. Dieser Impuls wird über eine einfache Leitung einem Filtersatz iW zugeführt, welcher nur das entsprechende Frequenzband durchläßt. Das Summensignal aller Filterausgänge ergibt dann das elektrische Sprachsignal, das über einen Verstärker V einem Lautsprecher L zugeführt wird.The fundamental wave information also still required for the application of the vocoder method, the so-called excitation function, with the frequency f A is obtained in a known manner in that the zero crossings of one direction are determined and a square pulse train is derived from each. The time interval between the rectangular pulses obtained in this way has the size Vf A , as shown above in FIG. 3. The rotational speed ω of the switch S is now, as shown in Fi g. 3 can be seen below, selected so that all η channels are scanned one after the other at a time interval Si / ω in the time l / f A. The respective output variables when scanning a channel are fed via k parallel lines to a digital-to-analog converter Z> v4 PF assigned to each channel, which generates an amplitude-modulated pulse corresponding to the value shown in the &-digit code. This pulse is fed to a filter set iW via a simple line, which only allows the corresponding frequency band to pass. The sum signal of all filter outputs then results in the electrical speech signal, which is fed to a loudspeaker L via an amplifier V.
F i g. 2 zeigt eine Vereinfachung der Anordnung nach Fig. 1 insofern, als hier ein einziger Digital-Analog-Wandler Ζλ^Ι-Ρ zwischen den Ausgang der elektronischen Datenverarbeitungsanlage EDV auf den Eingang des Schalters S eingeschaltet wird. Auf diese Weise wird der Aufwand an Digital-Analog-Wandlern erheblich verringert.F i g. 2 shows a simplification of the arrangement according to FIG. 1 in that a single digital-to-analog converter Ζλ ^ Ι-Ρ between the output of the electronic data processing system EDP is switched on to the input of the switch S here . In this way, the cost of digital-to-analog converters is considerably reduced.
In Fig.4 ist das Prinzip angegeben, wie durch Einfügung eines Pufferspeichers P in die k Verbindungsleitungen vom Ausgang der Datenverarbeitungsanlage EDV zum Schalter eine Möglichkeit geschaffen wird, die Daten zu von den Daten selbst, beispielsweise über die Steuerleitungen Se, bestimmten Zeitpunkten, gegebenenfalls mit transformierter Impulsfolgefrequenz, an den Schalter zu übertragen.4 shows the principle of how by inserting a buffer memory P into the k connecting lines from the output of the data processing system EDP to the switch, a possibility is created for the data at times determined by the data itself, for example via the control lines Se, if necessary with transformed pulse repetition frequency to be transmitted to the switch.
Dadurch kann dann auch die Abtastgeschwindigkeit des Schalters S beeinflußt werden.As a result, the scanning speed of the switch S can then also be influenced.
Claims (6)
Priority Applications (7)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DEJ25600A DE1219093B (en) | 1964-04-06 | 1964-04-06 | Method and arrangement for generating artificial speech from digital data on speech stored in an electronic data processing system |
| AT739164A AT247921B (en) | 1964-04-06 | 1964-08-26 | Method for generating artificial speech from digital data about speech stored in a calculating machine |
| GB1316765A GB1059802A (en) | 1964-04-06 | 1965-03-29 | Improvements relating to apparatus for converting digital data into artificial speech |
| CH430565A CH433829A (en) | 1964-04-06 | 1965-03-29 | Method for generating artificial speech from digital data stored in a calculating machine |
| NL6504101A NL6504101A (en) | 1964-04-06 | 1965-04-01 | |
| FR11898A FR1429758A (en) | 1964-04-06 | 1965-04-05 | Method for reproducing lyrics stored in digital form in a calculating machine |
| SE444365A SE316510B (en) | 1964-04-06 | 1965-04-06 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DEJ25600A DE1219093B (en) | 1964-04-06 | 1964-04-06 | Method and arrangement for generating artificial speech from digital data on speech stored in an electronic data processing system |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE1219093B true DE1219093B (en) | 1966-06-16 |
Family
ID=7202296
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DEJ25600A Pending DE1219093B (en) | 1964-04-06 | 1964-04-06 | Method and arrangement for generating artificial speech from digital data on speech stored in an electronic data processing system |
Country Status (6)
| Country | Link |
|---|---|
| AT (1) | AT247921B (en) |
| CH (1) | CH433829A (en) |
| DE (1) | DE1219093B (en) |
| GB (1) | GB1059802A (en) |
| NL (1) | NL6504101A (en) |
| SE (1) | SE316510B (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE2808577A1 (en) * | 1977-02-28 | 1978-10-19 | Sharp Kk | ELECTRONIC CALCULATOR WITH SYNTHETIC VOICE DISPLAY |
-
1964
- 1964-04-06 DE DEJ25600A patent/DE1219093B/en active Pending
- 1964-08-26 AT AT739164A patent/AT247921B/en active
-
1965
- 1965-03-29 CH CH430565A patent/CH433829A/en unknown
- 1965-03-29 GB GB1316765A patent/GB1059802A/en not_active Expired
- 1965-04-01 NL NL6504101A patent/NL6504101A/xx unknown
- 1965-04-06 SE SE444365A patent/SE316510B/xx unknown
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE2808577A1 (en) * | 1977-02-28 | 1978-10-19 | Sharp Kk | ELECTRONIC CALCULATOR WITH SYNTHETIC VOICE DISPLAY |
Also Published As
| Publication number | Publication date |
|---|---|
| GB1059802A (en) | 1967-02-22 |
| CH433829A (en) | 1967-04-15 |
| SE316510B (en) | 1969-10-27 |
| AT247921B (en) | 1966-07-11 |
| NL6504101A (en) | 1965-10-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69028738T2 (en) | Device for the transmission of digital data in analog form | |
| DE2546446A1 (en) | MULTIPLEX VOICE TRANSMISSION SYSTEM | |
| DE3850446T2 (en) | Method and device for attenuating the echo signal in conference fork circuits. | |
| DE2543921A1 (en) | METHOD AND DEVICE FOR TONE FREQUENCY TRANSMISSION | |
| DE3618896A1 (en) | CIRCUIT FOR MONITORING THE SWITCHING STATE OF TELEPHONE LINES | |
| DE1762492C3 (en) | Process and circuit for making the human voice audible for the severely hard of hearing | |
| DE1541624A1 (en) | Procedure for frequency conversion | |
| DE3033914A1 (en) | DIGITAL / ANALOG CONVERTER AND PCM CODER THEREFOR. | |
| DE1219093B (en) | Method and arrangement for generating artificial speech from digital data on speech stored in an electronic data processing system | |
| DE3033915C2 (en) | PCM decoder. | |
| DE1275152B (en) | Circuit arrangement for applying switching signals to a time division multiplex line in telecommunications systems | |
| DE1122581B (en) | Method and circuit arrangement for the approximate simulation of the short-term spectra of speech signals transmitted according to the vocoder method | |
| DE1206476B (en) | Method and arrangement for pulse reversal in a binary pulse messaging system | |
| DE2139546B2 (en) | Circuit arrangement for telephone systems with additional data traffic between the individual subscriber stations and a central one! Data processing system | |
| DE1462579C3 (en) | Sending-side circuit for combining and receiving-side circuit for separating a time-division multiplex signal | |
| DE1062286B (en) | Transmission system for speech signals with bandwidth reduction and circuit arrangement for encryption | |
| DE2115709A1 (en) | Terminal for data processing systems | |
| DE1462579B2 (en) | SEND-SIDE CIRCUIT FOR SUMMARY AND RECEIVE-SIDE CIRCUIT FOR SEPARATION OF A TIME MULTIPLEX SIGNAL | |
| DE3219445C2 (en) | ||
| DE1297163C2 (en) | PROCESS AND EQUIPMENT FOR ESTABLISHING TELEPHONE CONNECTIONS BETWEEN SUBSCRIBER STATIONS AND AN OFFICE | |
| DE2928398C2 (en) | Process for the digital transmission of analog signals | |
| DE2152280C3 (en) | Voice multiplex device for the multiple use of telephone channels | |
| DE1216373B (en) | Method and arrangement for dynamics control in vocoder systems | |
| DE1036337B (en) | Time division multiplex system | |
| DE1762775C3 (en) | System for the transmission of analog signals by means of pulse code modulation |