[go: up one dir, main page]

DE60131521T2 - Method and device for controlling the operation of a device or a system, and system having such a device and computer program for carrying out the method - Google Patents

Method and device for controlling the operation of a device or a system, and system having such a device and computer program for carrying out the method Download PDF

Info

Publication number
DE60131521T2
DE60131521T2 DE2001631521 DE60131521T DE60131521T2 DE 60131521 T2 DE60131521 T2 DE 60131521T2 DE 2001631521 DE2001631521 DE 2001631521 DE 60131521 T DE60131521 T DE 60131521T DE 60131521 T2 DE60131521 T2 DE 60131521T2
Authority
DE
Germany
Prior art keywords
emotion
variable
parameter
value
measure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE2001631521
Other languages
German (de)
Other versions
DE60131521D1 (en
Inventor
Pierre-Yves Oudeyer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony France SA
Original Assignee
Sony France SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP01401203A external-priority patent/EP1256931A1/en
Application filed by Sony France SA filed Critical Sony France SA
Application granted granted Critical
Publication of DE60131521D1 publication Critical patent/DE60131521D1/en
Publication of DE60131521T2 publication Critical patent/DE60131521T2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/10Prosody rules derived from text; Stress or intonation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Toys (AREA)
  • Feedback Control In General (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Description

Die Erfindung betrifft das Gebiet der Emotions-Synthese, bei der eine Emotion simuliert wird, beispielsweise in einem Sprachsignal, und sie hat insbesondere die Bereitstellung eines neuen Freiheitsgrades bei der Steuerung der Möglichkeiten zum Ziel, die durch Emotions-Synthesesysteme und Algorithmen angeboten werden.The The invention relates to the field of emotion synthesis, in which a Emotion is simulated, for example in a speech signal, and In particular, it has the provision of a new degree of freedom in controlling the possibilities to the goal offered by emotion synthesis systems and algorithms become.

Im Falle einer in Sprachdaten weiterzuleitenden bzw. zu übertragenden Emotion können diese verständliche Wörter oder unverständliche Ausdrücke oder Klänge, wie ein Gemurmel oder tierartige Geräusche, sein.in the Case of a voice data to be forwarded or transmitted Emotion can this understandable words or incomprehensible expressions or sounds, like a murmur or animal-like sounds.

Eine derartige Emotions-Synthese findet Anwendungen bei der Animation von Kommunikationsobjekten, wie unter Anderem bei Roboter-Tieren, menschenähnlichen Wesen, interaktiven Maschinen, Ausbildungs-Trainings-Vorrichtungen, Systemen zum Lesen von Texten, bei der Erzeugung von Klangspuren für Filme, bei Animationen, etc.A Such emotion synthesis finds applications in animation of communication objects, such as robotic animals, among others humanlike Beings, interactive machines, training training devices, Systems for reading texts, creating soundtracks for movies, in animations, etc.

1 veranschaulicht das Grundkonzept eines klassischen stimmhaften Emotions-Synthesesystems 2 auf der Grundlage eines Emotions-Simulationsalgorithmus. 1 illustrates the basic concept of a classical voiced emotion synthesis system 2 based on an emotion simulation algorithm.

Das System empfängt an einem Eingang 4 Sprachdaten Vin, die in typischer Weise neutral sind, und es erzeugt an einem Ausgang 6 Sprachdaten Vout, die eine emotionsbetonte Form der eingangsseitigen Sprachdaten Vin zeigen. Die Sprachdaten liegen in typischer Weise vor in Form eines Stromes aus Datenelementen, deren jedes einem Klangelement, wie einem Phonem oder einer Silbe entspricht. Ein Datenelement spezifiziert generell einen oder mehrere Werte betreffend die Tonhöhe und/oder die Intensität und/oder die Dauer des entsprechenden Klangelements. Die Sprach-Emotionssynthese arbeitet dadurch, dass Algorithmusschritte ausgeführt werden, die zumindest einen dieser Werte in einer festgelegten Weise modifizieren, um die geforderte Emotion hervorzurufen.The system receives at an input 4 Speech data Vin, which is typically neutral, and it generates at an output 6 Voice data Vout showing an emotion-emphasized form of the input-side voice data Vin. The speech data is typically in the form of a stream of data elements each corresponding to a sound element such as a phoneme or a syllable. A data item generally specifies one or more values concerning the pitch and / or intensity and / or duration of the corresponding clipping element. The speech-emotion synthesis works by performing algorithm steps that modify at least one of these values in a predetermined manner to produce the required emotion.

Der Emotion-Simulationsalgorithmus wird durch eine Reihe von Eingangsparametern P1, P2, P3, ..., PN bestimmt, die als Emotions-Einstellparameter bezeichnet werden und die an einem geeigneten Eingang 8 des Systems 2 zugeführt werden. Diese Parameter sind normalerweise numerische Werte und möglicherweise Indikatoren für eine Parametrisierung des Emotions-Simulationsalgorithmus, und sie werden generell empirisch bestimmt.The emotion simulation algorithm is determined by a series of input parameters P1, P2, P3, ..., PN, referred to as emotion adjustment parameters, and those at an appropriate input 8th of the system 2 be supplied. These parameters are usually numerical values and possibly indicators for parameterization of the emotion simulation algorithm, and they are generally determined empirically.

Jede darzustellende Emotion E weist ihre spezifische Reihe von Emotions-Einstellparametern auf. Bei dem Beispiel sind die Werte der Emotions-Einstellparameter P1, P2, P3, ..., PN gegeben mit C1, C2, C3, ..., CN für Ruhe, mit A1, A2, A3, ..., AN für Verärgerung bzw. Ärger, mit H1, H2, H3, ..., HN für Glück, mit S1, S2, S3, ..., SN für Traurigkeit.each Emotional E to be displayed has its specific set of emotion adjustment parameters on. In the example, the values are the emotion adjustment parameters P1, P2, P3, ..., PN given with C1, C2, C3, ..., CN for rest, with A1, A2, A3, ..., AN for annoyance or trouble, with H1, H2, H3, ..., HN for Luck, with S1, S2, S3, ..., SN for Sadness.

Es existieren außerdem Emotions-Simulationsalgorithmussysteme, die gänzlich generativ sind, und zwar insofern, als sie einen Eingangsstrom von Sprachdaten nicht umsetzen, sondern die emotionsbetonten Sprachdaten Vout intern erzeugen. Diese Systeme verwenden ebenfalls Reihen von Parametern P1, P2, P3, ..., PN analog dem oben beschriebenen System, um den Typ der zu erzeugenden Emotion zu bestimmen.It exist as well Emotional simulation algorithms that are entirely generative insofar as they do not implement an input stream of speech data, but generate the emotion-stressed voice data Vout internally. These Systems also use series of parameters P1, P2, P3, ..., PN analogous to the system described above to determine the type of the To determine emotion.

Wie auch immer das Emotions-Simulationsalgorithmussystem aussieht, besteht währenddessen diese Parametrisierungen effektiv die entsprechenden Emotionen synthetisieren können, ein Bedarf dahingehend, zusätzlich imstande zu sein, eine Größe bzw. ein Maß einer synthetisierten Emotion E zuordnen zu können. So ist es beispielsweise vorteilhaft, imstande zu sein, für eine bestimmte Emotion E einen Bereich einer Quantität bzw. eines Maßes der darzustellenden Emotion in den Sprachdaten Vout zu erzeugen, beispielsweise von leicht bis intensiv.As whatever the emotion simulation algorithm system looks like Meanwhile these parametrizations effectively synthesize the corresponding emotions can, a need to do so, in addition to be able, a size or a measure of one to be able to assign synthesized emotion E. That's the way it is, for example advantageous to be able to a certain emotion E a range of a quantity or a measure to generate the emotion to be represented in the speech data Vout, for example, from easy to intense.

Eine Möglichkeit wäre die Erzeugung von empirisch bestimmten zusätzlichen Sätzen von Parametern für eine bestimmte Emotion, wobei jeder Parameter einem Grad der darzustellenden Emotion entspricht. Eine derartige Lösung leidet jedoch an wesentlichen Nachteilen:
die Erarbeitung der zusätzlichen Sätze wäre äußerst arbeitsaufwändig,
ihre Speicherung in einer Anwendung würde einen Teil des Speichers belegen, was in einem hinsichtlich des Speichers eingeschränkten Gerät, wie in einem kleinen Roboter-Tier, nachteilig sein könnte,
die Verwaltung und Verarbeitung der zusätzlichen Sätze verbraucht signifikante Verarbeitungsleistung,
und unter dem Gesichtspunkt der Leistungsfähigkeit wäre es nicht ermöglicht,
Ausführungsformen in Betracht zu ziehen, die sanfte Änderungen in der Stärke bzw. in dem Maß der Emotion hervorrufen.
One possibility would be to generate empirically determined additional sets of parameters for a particular emotion, each parameter corresponding to one degree of the emotion to be represented. However, such a solution suffers from significant disadvantages:
the development of the additional rates would be extremely labor-intensive,
their storage in an application would occupy a portion of the memory, which could be detrimental to a memory-constrained device, such as a small robot animal,
the management and processing of the additional sets consumes significant processing power,
and from the standpoint of performance it would not be possible
Consider variations, the gentle changes in the strength or level of emotion cause.

Ein Beispiel einer Sprach-Synthetisiereinrichtung mit einer Emotion-Modellierung ist in der Veröffentlichung: Sato et al., "Emotion Modelling in Speech Production Using Emotion Space", IEEE Int'1 Workshop an Robot and Human Communication, 1996, Seiten 472–477 angegeben. Die darin beschriebne Emotions-Sprachsynthetisiereinrichtung erzeugt einen Emotionsinhalt dadurch, dass die neutrale Sprache im Pegel ihrer Zeit, Tonhöhe und Intensität abgespielt wird.One Example of a Speech Synthesizer with Emotion Modeling is in the publication: Sato et al., "Emotion Modeling in Speech Production Using Emotion Space ", IEEE Int'1 Workshop on Robot and Human Communication, 1996, pp. 472-477. The described therein Emotions-speech synthesizer creates an emotion content by having the neutral language in the level of their time, pitch and intensity is played.

Die Erfindung schlägt gemäß einer ersten Aufgabe ein Verfahren zur Steuerung des Betriebs eines Gerätes zum Synthetisieren einer Emotion vor, die in einen Klang übertragen wird, wobei das Gerät zumindest einen Eingang für einen Parameter aufweist, dessen Wert dazu herangezogen wird, einen Typ der weiterzuleitenden Emotion festzulegen. Das Verfahren umfasst die Schritte:
Programmieren des Eingangssignals/der Eingangssignale mit einer Parametrisierung zur Erzeugung eines bestimmten Emotionstyps und
Verleihen einer Variabilität in einem Maß des bestimmten Typs der Emotion, die weiterzuleiten ist.
The invention proposes, according to a first object, a method for controlling the operation of an apparatus for synthesizing an emotion which is transmitted into a sound, the apparatus having at least one input for a parameter whose value is used to determine a type of emotion to be relayed set. The method comprises the steps:
Programming the input signal (s) with a parameterization to generate a particular type of emotion and
Lending a variability in a measure of the particular type of emotion to be passed on.

Dieses Verfahren ist dadurch gekennzeichnet, dass die Variabilität hinsichtlich der Größe bzw. des Maßes eines bestimmten Emotionstyps dadurch erhalten wird, dass innerhalb eines bestimmten Steuerungsbereiches zumindest ein Parameter (Pi), der zur Festlegung des Emotionstyps verwendet wird, einer Auslenkung bzw. Abweichung von seinem Anfangs-Standardwert unterzogen wird.This Method is characterized in that the variability in terms the size or of measure of a certain type of emotion is obtained by that within a certain control range at least one parameter (Pi), which is used to determine the type of emotion, a deflection or Deviation from its initial default value.

Vorzugsweise ist zumindest ein variabler Parameter entsprechend einem lokalen Modell über den Steuerungsbereich variabel gemacht, wobei das Modell sich auf ein Maß bzw. eine Quantität der Emotions-Steuerungsvariablen für den variablen Parameter bezieht. Dadurch wird das Maß bzw. die Quantität der Emotions-Steuerungsvariablen dazu herangezogen, einen Wert des variablen Parameters variabel einzurichten bzw. festzulegen.Preferably is at least one variable parameter corresponding to a local one Model over the control area made variable, the model is based on a measure or a quantity refers to the emotion control variable variable variable. As a result, the measure or the quantity the emotion control variable used to variable a value of the variable parameter set up or set.

Das lokale Modell kann auf der Annahme basieren, dass – während verschiedene Sätze von einem Parameterwert oder mehreren Parameterwerten unterschiedlich identifizierbare Emotionen hervorrufen können – ein gewählter Satz des Parameters/der Parameterwerte zur Festlegung eines bestimmten Emotionstyps hinreichend stabil ist, um lokale Auslenkungen bzw. Abweichungen von dem Parameterwert/den Parameterwerten zu ermöglichen, ohne eine ungesteuerte Änderung in der Natur der entsprechenden Emotion hervorzurufen. Wie es erscheint, tritt die Änderung im Maß bzw. in der Quantität der Emotion auf. Der bestimmte Steuerungsbereich wird dann innerhalb des Bereichs der lokalen Auslenkungen bzw. Abweichungen liegen.The local model can be based on the assumption that - while different Sets of one or more parameter values produce identifiable emotions - a selected set of the parameter / s Parameter values sufficient for determining a particular type of emotion is stable to local excursions or deviations from the parameter value / To allow parameter values without an uncontrolled change to evoke the corresponding emotion in nature. As it seems the change occurs in the measure or in quantity the emotion. The particular control area will then be within of the range of local deflections or deviations.

Das Modell ist in vorteilhafter Weise ein lokales lineares Modell für den Steuerungsbereich und für einen bestimmten bzw. vorgegebenen Emotionstyp, wobei der variable Parameter so gebildet ist, dass er sich linear über den Steuerungsbereich durch die Größe der Emotions-Steuerungsvariablen linear ändert.The Model is advantageously a local linear model for the control area and for a certain or predetermined type of emotion, the variable Parameter is formed so that it is linear over the control range through the size of the emotion control variable changes linearly.

Bei einer bevorzugten Ausführungsform modifiziert die Größe bzw. das Maß der Emotions-Steuerungsvariablen (δ) den variablen Parameter entsprechend einer Beziehung, die durch folgende Formel gegeben ist: VPi = A + δB;hierin bedeuten

VPi
den Wert des fraglichen variablen Parameters,
A und B
Werte, die durch den Steuerungsbereich zugelassen sind, und
δ
die Größe der Emotions-Steuerungsvariablen.
In a preferred embodiment, the magnitude of the emotion control variable (δ) modifies the variable parameter according to a relationship given by the formula: VPi = A + δB; mean here
VPi
the value of the variable parameter in question,
A and B
Values permitted by the control area, and
δ
the size of the emotion control variable.

Vorzugsweise ist A ein Wert innerhalb des Steuerungsbereichs; dadurch ist die Größe bzw. das Maß der Emotions-Steuerungsvariablen in einem Intervall variabel, welches den Wert Null enthält.Preferably A is a value within the control area; this is the Size or the measure of Emotions control variables in an interval variable, which contains the value zero.

Der Wert A kann im Wesentlichen der Mittelwert des Steuerungsbereichs sein, und die Größe der Emotions-Steuerungsvariablen kann in einem Intervall variabel sein, dessen Mittenwert Null ist.Of the Value A can be essentially the mean of the control range and the size of the emotion control variables may be variable in an interval whose center value is zero.

Die Größe bzw. das Maß der Emotions-Steuerungsvariablen ist vorzugsweise in einem Intervall von –1 bis +1 variabel.The Size or the measure of Emotions control variables are preferably in one interval from 1 to +1 variable.

Bei der bevorzugten Ausführungsform ist der Wert B bestimmt durch:
B = (Eimax – A) oder durch
B = (Eimin + A).
In the preferred embodiment, the value B is determined by:
B = (Eimax - A) or by
B = (Eimin + A).

Hierin bedeutet Eimax den Wert des Eingangsparameters zur Erzeugung der maximalen Größe bzw. des maximalen Maßes des Emotionstyps, der in dem Steuerungsbereich zu übertragen ist, und
Eimin bedeutet den Wert des Parameters zur Erzeugung der minimalen Größe des Emotionstyps, der in dem Steuerungsbereich zu übertragen ist.
Here, Eimax means the value of the input parameter for generating the maximum size or the maximum measure of the emotion type to be transmitted in the control area, and
Eimin means the value of the parameter for generating the minimum size of the emotion type to be transmitted in the control area.

Der Wert A kann gleich dem Standard-Parameter sein, der ursprünglich zur Festlegung eines zu übertragenden Emotionstyps spezifiziert worden ist.Of the Value A may be equal to the default parameter originally used for Determination of a to be transferred Emotion type has been specified.

Der Wert Eimax oder Eimin kann durch Auslenken des Standard-Parameterwerts, der ursprünglich spezifiziert worden ist, um einen zu übertragenden Emotionstyp festzulegen, und durch Bestimmen einer maximalen Auslenkung in einer Zunahme- oder Abnahmerichtung, die zu einer gewünschten Grenze für die Größe bzw. das Maß der Emotion führt, welche bzw. welches durch den Steuerungsbereich zu übertragen ist, experimentell bestimmt werden.Of the Value Eimax or Eimin can be determined by deflecting the default parameter value, originally specified been to transfer one Determine emotion type and by determining a maximum displacement in an increase or Acceptance direction leading to a desired limit for the size or the measure of Emotion leads, which or which to transmit through the control area is to be determined experimentally.

Die Erfindung ermöglicht es, dieselbe Größe bzw. dasselbe Maß einer Emotions-Steuerungsvariablen zu nutzen, um kollektiv eine Vielzahl von variablen Parametern des Emotions-Synthetisiergeräts einzurichten.The Invention allows it, the same size or same measure of a Emotions control variables too to collectively use a variety of variable parameters of the Emotions-synthesizer to set up.

Gemäß einem zweiten Aspekt bezieht sich die Erfindung auf eine Vorrichtung zur Steuerung des Betriebs eines Systems zum Synthetisieren einer Emotion, die in einen Klang übertragen wird, wobei das System zumindest einen Eingang für einen Parameter aufweist, dessen Wert zur Festlegung eines zu übertragenden Emotionstyps herangezogen wird. Diese Vorrichtung ist dadurch gekennzeichnet, dass sie eine Einrichtung bzw. Mittel zum Programmieren des Eingangssignals/der Eingangssignale mit einer Parametrisierung zur Erzeugung eines bestimmen Emotionstyps und Änderungseinrichtungen zum Übertragen einer Variabilität in einer Größe bzw. in einem Maß des zu übertragenden Emotionstyps enthält, und sie ist dadurch gekennzeichnet, dass die Änderungseinrichtungen imstande sind, innerhalb eines bestimmten Steuerungsbereiches zumindest einen Parameter, der zur Festlegung eines Emotionstyps verwendet wird, einer Auslenkung aus seinem Anfangs-Standardwert zu unterziehen.According to one second aspect, the invention relates to a device for Controlling the operation of a system for synthesizing an emotion, which translate into a sound with the system having at least one input for a parameter, its value is used to determine an emotion type to be transmitted becomes. This device is characterized in that it has a Means for programming the input signal (s) Input signals with a parameterization for generating a determine Emotion type and change facilities to transfer a variability in a size or in a measure of to be transferred Contains emotion type, and it is characterized in that the changing means are capable are within a certain control range at least one Parameter used to define an emotion type undergo a deflection from its initial default value.

Die optionalen Merkmale der oben im Zusammenhang mit dem ersten Aspekt (dem Verfahren) dargestellten Erfindung sind mit den notwendigen Änderungen bei dem zweiten Aspekt (Vorrichtung) entsprechend anwendbar und sollen der Kürze halber nicht wiederholt werden.The optional features of the above related to the first aspect (the method) invention are with the necessary changes in the second aspect (device) according to applicable and should be short half not be repeated.

Gemäß einem dritten Aspekt bezieht sich die Erfindung auf die Nutzung der obigen Vorrichtung zur Einstellung einer Emotionsgröße in einem Gerät zum Synthetisieren einer in einen Klang übertragenen Emotion.According to one third aspect, the invention relates to the use of the above Device for setting an emotion size in a device for synthesizing one in a sound transmitted Emotion.

Gemäß einem vierten Aspekt bezieht sich die Erfindung auf ein System, welches ein Emotions-Synthesegerät, die zumindest einen Eingang für die Aufnahme zumindest eines Parameters aufweist, dessen Wert zur Festlegung eines zu übertragenden Emotionstyps verwendet wird, und eine Vorrichtung gemäß dem dritten Aspekt umfasst, die arbeitsmäßig so angeschlossen ist, dass sie eine Variable an den zumindest einen Eingang abgibt, um dadurch eine Variabilität hinsichtlich einer Größe eines zu übertragenden Emotionstyps zu übertragen.According to one fourth aspect, the invention relates to a system which an emotion synthesizer, the at least one entrance for has the inclusion of at least one parameter whose value for Determination of a to be transferred Emotionstyps is used, and a device according to the third aspect includes, the work-wise so connected is that it gives a variable to the at least one input, thereby a variability in terms of a size of a to be transferred Emotion type to transfer.

Gemäß einem fünften Aspekt bezieht sich die Erfindung auf ein Computerprogramm, welches durch einen Computer ausführbare Befehle bereitstellt. Dieses Programm veranlasst dann, wenn es in einen Datenprozessor geladen ist, den Datenprozessor, entsprechend dem obigen Verfahren zu arbeiten. Das Computerprogramm kann in einem Aufzeichnungsträger irgendeiner geeigneten Form verkörpert sein.According to one fifth Aspect, the invention relates to a computer program, which by a computer executable Provides commands. This program then initiates when it is in a data processor is loaded, the data processor, accordingly to work the above procedure. The computer program can be in one record carrier of any suitable form be.

Die Erfindung und ihre Vorteile werden unter Bezugnahme auf die beigefügten Zeichnungen aus der folgenden Beschreibung der bevorzugten Ausführungsformen näher ersichtlich werden, die lediglich als nicht beschränkende Beispiele gegeben sind.The The invention and its advantages will become apparent with reference to the accompanying drawings from the following description of the preferred embodiments closer which are given purely as non-limiting examples.

In den Zeichnungen zeigenIn show the drawings

1 – bereits beschrieben – ein klassisches Emotions-Simulationsalgorithmussystem des Typs, der neutrale Sprachdaten umsetzt, 1 Already described, a classic emotion simulation algorithm of the type that implements neutral speech data,

2 ein Blockdiagramm einer Größe bzw. eines Maßes eines Emotions-Änderungssystems gemäß einer bevorzugten Ausführungsform der Erfindung, 2 10 is a block diagram of a magnitude of an emotion alteration system according to a preferred embodiment of the invention;

3 ein Blockdiagramm eines Beispiels eines Operator-basierten Emotions-Erzeugungssystems, welches die Größe bzw. das Maß des Emotions-Änderungssystems gemäß 2 realisiert, 3 10 is a block diagram of an example of an operator-based emotion generation system that determines the size of the emotion change system according to FIG 2 realized,

4 eine schematische Darstellung von Tonhöhen-Operatoren, die von dem System gemäß 3 genutzt werden, 4 a schematic representation of pitch operators, by the system according to 3 be used,

5 eine schematische Darstellung von Intensitäts-Operatoren, die optional in dem System gemäß 3 genutzt werden können, 5 a schematic representation of intensity operators, optionally in the system according to 3 can be used

6 eine schematische Darstellung von Dauer-Operatoren, die durch das System gemäß 3 genutzt werden, und 6 a schematic representation of persistent operators by the system according to 3 be used, and

7A und 7B ein Ablaufdiagramm eines Emotions-Erzeugungsprozesses, der auf Silbendaten durch das System gemäß 3 hin ausgeführt wird, wobei 7B eine Fortsetzung der 7A darstellt. 7A and 7B a flow chart of an emotion generation process, which is based on syllable data by the system according to 3 is carried out, where 7B a continuation of 7A represents.

2 veranschaulicht die funktionalen Einheiten und die Arbeitsweise einer Größe bzw. eines Maßes eines Emotions-Änderungssystems 10 gemäß einer bevorzugten Ausführungsform der Erfindung, wobei der Betrieb in Verbindung mit einem sprachbasierten Emotions-Simulationsalgorithmussystem 12 erfolgt. Bei dem Beispiel ist das zuletzt genannte System vom generativen Typ, d. h. es weist seine eigenen Einrichtungen zur Erzeugung von Sprachdaten auf, die eine bestimmte Emotion E übertragen. Die Ausführungsform 10 kann selbstverständlich ebenso mit irgendeinem anderen Typ eines Emotions-Simulationsalgorithmussystems arbeiten, wie mit jenem, welches unter Bezugnahme auf 1 beschrieben worden ist, bei dem ein Strom von neutralen Sprachdaten einem Eingang zugeführt wird. Diese beiden Arten bzw. Typen von Emotions-Simulationsalgorithmussystemen sowie andere Typen von Systemen, mit denen die Ausführungsform arbeiten kann, sind im Stand der Technik bekannt. Mehr Informationen bezüglich sprachbasierter Emotions-Simulationsalgorithmen und – systeme kann u. a. gefunden werden bei: Cahn, J. (1990) "The generation of affect in synthesised speech", Journal of the 1/0 Voice American Society, 8: 1–19; Iriondo I., et al (2000) "Validation of an acoustical modelling of emotional expression in Spanish using speech synthesis techniques", Proceedings of ISCA workshop an speech and emotion; Edington M. D. (1997) "Investigating the limitations of concatenative speech synthesis", Proceedings of EuroSpeech '97, Rhodes, Griechenland; Iida A., et al (2000) "A speech synthesis system with emotion for assisting communication", ISCA workshop an speech and emotion. 2 illustrates the functional units and the operation of a size of a emotion change system 10 according to a preferred embodiment of the invention, wherein the operation is in conjunction with a speech-based emotion simulation algorithm system 12 he follows. In the example, the latter system is of the generative type, that is, it has its own means for generating speech data transmitting a particular emotion E. Of course, embodiment 10 may also work with any other type of emotion simulation algorithm system, such as that described with reference to FIG 1 has been described, in which a stream of neutral speech data is supplied to an input. These two types of emotion simulation algorithm systems as well as other types of systems with which the embodiment can operate are known in the art. More information regarding speech-based emotion simulation algorithms and systems can be found inter alia in: Cahn, J. (1990) "The Generation of Affected in Synthesised Speech", Journal of the 1/0 Voice American Society, 8: 1-19; Iriondo I., et al. (2000) "Validation of an Acoustical Modeling of Emotional Expression in Spanish using speech synthesis techniques", Proceedings of ISCA workshop on speech and emotion; Edington MD (1997) "Investigating the limitations of concatenative speech synthesis", Proceedings of EuroSpeech '97, Rhodes, Greece; Iida A., et al (2000) "A speech synthesis system with emotion for assisting communication", ISCA workshop on speech and emotion.

Außerdem sind Emotions-Syntheseverfahren und -geräte in den folgenden beiden anhängigen europäischen Patentanmeldungen des Anmelders beschrieben, von denen für die vorliegende Anmeldung die Priorität beansprucht wird: europäische veröffentlichte Anmeldungen EP-A-1.256.931 , eingereicht am 11.05.2001 und EP-A-1.256.932 , eingereicht am 13.07.2001.In addition, emotion synthesis methods and apparatus are described in the applicant's copending European patent applications, the priority of which is claimed in the present application: European Published Applications EP-A-1256931 , filed on 11.05.2001 and EP-A-1256932 , filed on 13.07.2001.

Das Emotions-Simulationsalgorithmussystem 12 nutzt eine Anzahl N von Emotions-Einstellparametern P1, P2, P3, ..., PN (allgemein mit P bezeichnet), um eine bestimmte Emotion E zu erzeugen, wie dies oben unter Bezugnahme auf 1 erläutert worden ist. Die Zahl N dieser Parameter kann beträchtlich von einem Algorithmus zum anderen variieren, in typischer Weise von 1 bis 16 oder beträchtlich mehr. Diese Parameter P sind empirisch bestimmte numerische Werte oder Indikatoren, die in Rechen- oder Entscheidungsschritten des Algorithmus ausgenutzt werden. Sie können in das Emotions-Simulationsalgorithmussystem 12 entweder durch ein zweckbestimmtes Interface oder durch eine Parameter-Laderoutine geladen werden. In dem Beispiel ist die Einfügung der Parameter P symbolisch durch Linien dargestellt, die in das System 12 eintreten, wobei ein geeignetes Interface oder eine geeignete Ladeeinheit integriert sind, um die Einführung dieser Parameter von außen her zu ermöglichen.The emotion simulation algorithm system 12 uses a number N of emotion adjustment parameters P1, P2, P3, ..., PN (indicated generally by P) to generate a particular emotion E, as described above with reference to FIG 1 has been explained. The number N of these parameters can vary considerably from one algorithm to another, typically from 1 to 16, or considerably more. These parameters P are empirically determined numerical values or indicators that are utilized in computation or decision steps of the algorithm. You can enter the emotion simulation algorithm system 12 either loaded by a dedicated interface or by a parameter loader routine. In the example, the insertion of the parameter P is symbolically represented by lines in the system 12 occur, with a suitable interface or a suitable charging unit are integrated to allow the introduction of these parameters from the outside.

Das Emotions-Simulationsalgorithmussystem 12 kann somit unterschiedliche Arten bzw. Typen von Emotionen E, wie Ruhe, Ärger, Glück bzw. Fröhlichkeit, Traurigkeit, etc. durch eine geeignete Reihe von N-Werten für die betreffenden Parameter P1, P2, P3, ..., PN hervorrufen. In dem betrachteten Fall ist das System 12 zunächst für die folgende Parametrisierung programmiert: P1 = E1, P2 = E2, P3 = E3, ..., PN = EN, um eine bestimmte Emotion E zu erzeugen. Die Werte E1–EN sind bereits ermittelt, um die Emotion E zu erzielen.The emotion simulation algorithm system 12 may thus cause different types of emotions E, such as rest, anger, happiness, sadness, etc., through a suitable series of N values for the respective parameters P1, P2, P3, ..., PN. In the case considered, the system is 12 programmed first for the following parameterization: P1 = E1, P2 = E2, P3 = E3, ..., PN = EN to generate a certain emotion E. The values E1-EN are already determined in order to achieve the emotion E.

Das Emotions-Änderungssystem 10 arbeitet bezüglich der Größe der Emotion so, dass eine Änderung diesen Werten E1–EN entsprechend einem linearen Modell auferlegt wird. Mit anderen Worten ausgedrückt heißt dies, dass angenommen wird, dass eine lineare – oder progressive – Änderung von E1–EN eine progressive Änderung im Ansprechverhalten des Emotions-Simulationsalgorithmussystems 12 hervorruft. Wie durch den Anmelder bemerkenswerterweise entdeckt, wird das fragliche Ansprechverhalten eine Änderung in der Größe, d. h. der Intensität der Emotion E zumindest bezüglich eines bestimmten Variationsbereiches der Werte E1–EN hervorrufen bzw. sein.The emotion change system 10 works with respect to the size of the emotion so that a change is imposed on these values E1-EN according to a linear model. In other words, it is assumed that a linear - or progressive - change of E1-EN is a progres sive change in the response of the emotion simulation algorithm system 12 causes. As remarkably discovered by the applicant, the response in question will cause a change in the magnitude, ie the intensity of the emotion E, at least with respect to a certain range of variation of the values E1-EN.

Um die obigen Änderungen bzw. Variationen in den Werten E1–EN hervorzurufen, wird zunächst ein Bereich einer möglichen Änderung für jeden dieser Werte bestimmt. Für einen bestimmten Parameter Pi (i ist eine beliebige ganze Zahl zwischen 1 und N einschließlich) wird eine Untersuchung des Emotions-Simulationsalgorithmussystems 12 vorgenommen, währenddessen ein Parameter Pi einer Auslenkung von seinem Anfangs-Standardwert Ei bis zu einem Wert Eimax unterzogen wird, der als einer maximalen Intensität der Emotion E entsprechend ermittelt ist. Dieser Wert Eimax wird experimentell bestimmt. Er wird generell einem Wert entsprechen, oberhalb dessen der Parameter entweder nicht mehr zu einer signifikanten Steigerung in der Intensität der Emotion E beiträgt (d. h. eine Sättigung tritt auf), oder unterhalb dessen der Emotionstyp E modifiziert oder entstellt wird. Es sei darauf hingewiesen, dass der Wert Eimax entweder größer oder kleiner als der Standardwert Ei sein kann: in Abhängigkeit vom Parameter Pi kann die Steigerung in der Intensität der Emotion aus einer Steigerung oder Verringerung des Standardwertes Ei resultieren.To evoke the above variations in the values E1-EN, first, a range of possible change is determined for each of these values. For a given parameter Pi (i is any integer between 1 and N inclusive) becomes a study of the emotion simulation algorithm system 12 during which a parameter Pi is subjected to a deflection from its initial default value Ei to a value Eimax determined to correspond to a maximum intensity of the emotion E. This value Eimax is determined experimentally. It will generally correspond to a value above which the parameter either no longer contributes to a significant increase in the intensity of the emotion E (ie a saturation occurs), or below which the emotion type E is modified or disfigured. It should be noted that the value Eimax may be either greater or less than the standard value Ei: depending on the parameter Pi, the increase in the intensity of the emotion may result from an increase or decrease in the standard value Ei.

Die Bestimmung des maximalen Intensitätswertes Eimax für den Parameter Pi kann entweder dadurch vorgenommen werden, dass alle anderen Parameter beim Anfangs-Standardwert gehalten werden oder dass einige oder sämtliche der anderen Parameter entsprechend einer Kenntnis der Wechselwirkung der verschiedenen Parameter P1–PN variiert werden.The Determination of the maximum intensity value Eimax for the parameter Pi can either be made by all the other parameters at the initial default value be held or that some or all of the other parameters according to a knowledge of the interaction of the different Parameter P1-PN be varied.

Die obige Prozedur folgt einem lokalen Modell des steuerbaren Verhaltens um die Standard-Parameterwerte Pi, die als hinreichend stabil angenommen sind, um lokale Abweichungen bzw. Auslenkungen von ihrem zunächst gewählten Wert zu ermöglichen und um eine gesteuerte Änderung innerhalb der Emotion zu erreichen, der sie zugehörig sind. Der bestimmte Steuerungsbereich liegt dann innerhalb des Bereiches der lokalen Auslenkungen bzw. Abweichungen.The The above procedure follows a local model of controllable behavior around the standard parameter values Pi, which assumed to be sufficiently stable are local deviations from their initially chosen value to enable and a controlled change to achieve within the emotion to which they belong. The particular control area is then within the range the local deflections or deviations.

Nach dieser anfänglichen Einrichtungsphase wird ein Satz von maximalen Intensitäts-Parameterwerten E1max, E2max, E3max, ..., ENmax erhalten, deren jeder der maximalen Intensität der Emotion E entspricht, die durch den jeweiligen Parameter P1, P2, P3, ..., PN hervorgerufen ist. Diese maximalen Intensitäts-Parameterwerte werden in einer Speichereinheit 14 in Zuordnung zu dem entsprechenden Standard-Anfangsparameterwert Ei gespeichert. Somit ordnet die Speichereinheit 14 bezüglich eines Parameters Pi zwei Werte zu: Ei und Eimax. Bei einer typischen Anwendung wird die obige Prozedur für jeden Typ der Emotion E ausgeführt, um durch die Emotions-Simulationsalgorithmuseinheit 12 erzeugt zu werden, und bezüglich dessen eine Größe bzw. ein Maß der betreffenden Emotion gesteuert werden muss. Jede Emotion E weist ihren entsprechenden zugehörigen Satz von Werten Ei und Eimax auf, die in der Speichereinheit 14 gespeichert sind.After this initial setup phase, a set of maximum intensity parameter values E1max, E2max, E3max, ..., ENmax are obtained, each corresponding to the maximum intensity of the emotion E determined by the respective parameter P1, P2, P3, ..., PN is caused. These maximum intensity parameter values are stored in a memory unit 14 stored in association with the corresponding default initial parameter value Ei. Thus, the storage unit arranges 14 with respect to a parameter Pi two values to: Ei and Eimax. In a typical application, the above procedure is performed for each type of emotion E to be processed by the emotion simulation algorithm unit 12 to be generated and with respect to which a size or a measure of the relevant emotion must be controlled. Each emotion E has its corresponding associated set of values Ei and Eimax stored in the memory unit 14 are stored.

Die in der Speichereinheit 14 gespeicherten Werte werden durch eine Parameter-Generatoreinheit 16 für einen variablen Parameter ausgenutzt, deren Funktion darin besteht, die Parameter P1–PN des Emotions-Simulationsalgorithmussystems 12 durch entsprechende variable Parameter VP1–VPN zu ersetzen.The in the storage unit 14 stored values are passed through a parameter generator unit 16 exploited for a variable parameter whose function consists of the parameters P1-PN of the emotion simulation algorithm system 12 to replace VP1-VPN with appropriate variable parameters.

Die Parameter-Generatoreinheit 16 für den variablen Parameter erzeugt jeden variablen Parameter VPi auf der Grundlage einer gemeinsamen Steuerungsvariablen und der zugehörigen Werte Ei und Eimax entsprechend der folgenden Formel: VPi = Ei + δ(Eimax – Ei) (1). The parameter generator unit 16 for the variable parameter generates each variable parameter VPi based on a common control variable and the associated values Ei and Eimax according to the following formula: VPi = Ei + δ (Eimax - Ei) (1).

Es kann festgestellt werden, dass diese Gleichung einem linearen Modell mit einer Standardform y = mx + c folgt, wobei y gegeben ist mit VPi, wobei m gegeben ist mit (Eimax – Ei), wobei x gegeben ist mit δ und wobei c gegeben ist mit Ei.It can be found that this equation is a linear model with a standard form y = mx + c, where y is given by VPi, where m is given by (Eimax - Ei), where x is given with δ and where c is given with egg.

Die so durch die Parameter-Generatoreinheit bzw. Parametererzeugungseinheit 16 für variable Parameter erzeugten variablen Parameterwerte VP1–VPN werden an den jeweiligen Ausgängen 17-1 bis 17-N abgegeben, die mit den jeweiligen Parameter-Aufnahmeeingängen 13-1 bis 13-N des Emotions-Simulationsalgorithmussystems 12 verbunden sind. Natürlich kann die schematische Darstellung dieser Verbindungen von der Parameter-Generatoreinheit 16 für variable Parameter zu dem Emotions-Simulationsalgorithmussystem 12 in irgendeiner geeigneten Form verkörpert sein: paralleler oder serieller Datenbus, drahtlose Verbindung, etc. unter Heranziehung irgendeines geeigneten Datenübertragungsprotokolls. Das Laden der variablen Parameter VP kann durch eine Routine in der Ebene des Emotions-Simulationsalgorithmussystems 12 gesteuert werden.The way through the parameter generator unit or parameter generation unit 16 variable parameter values generated for variable parameters VP1-VPN are at the respective outputs 17-1 to 17-N delivered with the respective parameter inputs 13-1 to 13-N of the emotion simulation algorithm system 12 are connected. Of course, the schematic representation of these connections from the parameter generator unit 16 for variable parameters to the emotion simulation algorithm system 12 may be embodied in any suitable form: parallel or serial data bus, wireless connection, etc. using any suitable data transmission protocol. Loading the variable para meter VP can through a routine in the plane of the emotion simulation algorithm system 12 to be controlled.

Die Steuerungsvariable δ liegt im Bereich von –1 bis +1 einschließlich. Ihr Wert wird durch eine Emotionsgrößen- bzw. Emotionsmaß-Auswahleinrichtung 18 festgelegt, die ein für einen Benutzer zugängliches Interface oder eine elektronische Steuereinheit sein kann, welche entsprechend einem Programm arbeitet, das die Größe bzw. das Maß der zu erzeugenden Emotion bestimmt, wie beispielsweise als Funktion eines externen Befehls, der die betreffende Größe bzw. das Maß angibt, oder automatisch in Abhängigkeit von der Umgebung, der Historie, dem Zusammenhang, etc. des Betriebs, beispielsweise eines Roboter-Tieres oder dergleichen.The control variable δ is in the range of -1 to +1 inclusive. Their value is determined by an emotion size selector 18 which may be a user-accessible interface or electronic control unit which operates in accordance with a program which determines the magnitude of the emotion to be generated, such as a function of an external command indicating the size or dimension in question Indicates measure, or automatically depending on the environment, the history, the context, etc. of the operation, such as a robot animal or the like.

In der Figur ist der Bereich der Änderung von δ als Skala 20 dargestellt, längs der ein Zeiger 22 verschoben werden kann, um den geforderten Wert von δ im Intervall [–1, 1] festzulegen. In einem Fall, in welchem das Maß der Emotion durch einen Benutzer steuerbar ist, können die Skala 20 und der Zeiger 22 durch ein Grafik-Interface verkörpert sein, um als Cursor auf einem Monitor-Anzeigebildschirm eines Computers angezeigt zu werden, oder sie bilden einen Teil eines Roboter-Tieres. Der Zeiger 22 kann dann durch eine Tastatur, Knöpfe, eine Maus oder dergleichen. verschiebbar sein.In the figure, the range of change of δ is a scale 20 represented, along which a pointer 22 can be shifted to set the required value of δ in the interval [-1, 1]. In a case where the level of emotion is controllable by a user, the scale can 20 and the pointer 22 may be embodied by a graphics interface to be displayed as cursors on a monitor display screen of a computer or form part of a robot animal. The pointer 22 can then through a keyboard, buttons, a mouse or the like. be displaceable.

Die Skala kann außerdem durch ein Potentiometer oder eine ähnliche veränderbare Komponente festgelegt sein.The Scale can also determined by a potentiometer or similar variable component be.

Die Werte von δ können im Grunde kontinuierlich oder schrittweise inkremental über den Bereich [–1, +1] sein.The Values of δ can be in Basically continuously or incrementally incrementally over the Range [-1, +1] be.

Der durch den Zeiger 20 bestimmte Wert von δ wird durch eine Emotionsmaß-Auswahleinheit 18 erzeugt und an einen Eingang 22 der Parametererzeugungseinheit 16 für variable Parameter abgegeben, die imstande ist, die Steuerungsvariable aufzunehmen, um sie in die obige Formel (1) einzusetzen.The one by the pointer 20 certain value of δ is determined by an emotion selection unit 18 generated and sent to an entrance 22 the parameter generation unit 16 for variable parameters capable of picking up the control variable to be inserted into the above formula (1).

Die Anwendung einer im Intervall [–1, +1] normierten Skala ist insofern von Vorteil, als dies die Verwaltung der Werte vereinfacht, die durch die Parametererzeugungseinheit 16 für variable Parameter verwendet werden. Genauer gesagt ermöglicht dies, die Werte der Speichereinheit 14 direkt zu verwenden, wie sie in der Formel (1) enthalten sind, ohne die Forderung nach Einführung eines Skalierungsfaktors. Andere Intervalle können jedoch für den Bereich von δ berücksichtigt werden, einschließlich Bereiche, die asymmetrisch in Bezug auf die Position δ = 0 sind (für die die Formel (1) die Standard-Parametereinstellung VPi = Ei zurückbringt). Die Implementierung der Formel (1) ermöglicht es, den Bereich der variablen Parameter-VPi-Werte von dem minimalen Emotions-Intensitätswert Eimin = 2Ei – Eimax (im Falle von δ = –1) bis zu Eimax (im Falle von δ = +1) zu überstreichen. Dieser numerische Wert für Eimin hat sich als Wert herausgestellt, der innerhalb des erwarteten Bereichs des Emotionsmaßes liegt, welcher durch eine derartige Lösung auf der Grundlage eines linearen Modells gesteuert werden kann. Mit anderen Worten ausgedrückt heißt dies, dass festgestellt worden ist, dass der so erhaltene Wert von Eimin in der Tat dem akzeptablen niedrigsten Emotionsgrad entspricht, der bei einer Standard-Parametereinstellung Ei (entsprechend δ = 0) auszudrücken ist, die dem Ausdruck effektiv gegeben ist, um ein im Wesentlichen im mittleren Bereich liegendes Maß der Emotionseinstellung zu sein. Es kann jedoch vorgesehen sein, einen beliebigen Mittelbereichswert Emr zu wählen, der nicht notwendigerweise gleich Ei ist. Die Formel (1) wäre dann allgemeiner gegeben durch VPi = Emr + δ(Eimax – Emr).The application of a scale standardized in the interval [-1, +1] is advantageous in that it simplifies the management of the values generated by the parameter generation unit 16 be used for variable parameters. More specifically, this allows the values of the storage unit 14 to use directly as contained in the formula (1) without the requirement of introducing a scaling factor. However, other intervals may be considered for the range of δ, including ranges that are asymmetric with respect to the position δ = 0 (for which formula (1) returns the default parameter setting VPi = Ei). The implementation of formula (1) makes it possible to calculate the range of variable parameter VPi values from the minimum emotion intensity value Eimin = 2Ei-Eimax (in the case of δ = -1) to Eimax (in the case of δ = +1 ). This numerical value for Eimin has been found to be within the expected range of emotion that can be controlled by such a solution based on a linear model. In other words, it has been found that the value of Eimin thus obtained is indeed the acceptable lowest level of emotion to be expressed at a standard parameter setting Ei (corresponding to δ = 0) effectively given to the term to be a substantially middle-range measure of emotion adjustment. However, it may be provided to select any midrange value Emr which is not necessarily equal to Ei. Formula (1) would then be given more generally by VPi = Emr + δ (Eimax-Emr).

Die Ausführungsform ist insofern bemerkenswert, als dieselbe Variable δ zur Änderung jedes der N variablen Parameterwerte VPi für das Emotions-Simulationsalgorithmussystem 12 dient, während die jeweiligen Bereiche von Werten für die Parameter P1–PN abgedeckt sind.The embodiment is noteworthy as the same variable δ for changing each of the N variable parameter values VPi for the emotion simulation algorithm system 12 serves while the respective ranges of values for the parameters P1-PN are covered.

Es sei darauf hingewiesen, dass das Änderungsgesetz entsprechend der Formel (1) imstande ist, sowohl Parameter zu verwalten, deren Wert zu erhöhen ist, um ein gesteigertes Maß an Emotion hervorzurufen, als auch Parameter zu verwalten, deren Wert zu verkleinern ist, um ein gesteigertes Maß an Emotion hervorzurufen. Im zuletzt genannten Fall wird der fragliche Wert Eimax kleiner sein als Ei. Der in Klammern gesetzte Term der Formel (1) wird dann negativ sein, und zwar mit einer Größe, die zunimmt, wenn das durch die Variable δ gewählte Emotionsmaß im Bereich zwischen 0 und +1 zunimmt. Für eine zunehmende negative Größe δ wird der Term δ (Eimax – Ei) positiv und trägt zur Vergrößerung von VPi und dadurch zur Verringerung des Emotionsmaßes bei.It It should be noted that the amendment law accordingly of the formula (1) is capable of managing both parameters whose Increase value is to an increased degree To evoke emotion, as well as to manage parameters whose value to downsize to evoke an increased level of emotion. In the latter case, the value Eimax in question becomes smaller be as an egg. The parenthetical term of formula (1) then becomes be negative, with a size that increases when that is through the variable δ chosen emotion measure in the range between 0 and +1 increases. For an increasing negative magnitude δ becomes the Term δ (Eimax - Ei) positive and carries to enlarge VPi and thus to reduce the emotion at.

Überdies werden für sämtliche Werte von δ die variablen Parameter VP jeweils dieselbe relative Position in ihrem jeweiligen Bereich besitzen, wodurch die durch die Emotionsmaß-Auswahleinrichtung 14 hervorgerufene Änderung gut ausgeglichen und über die variablen Parameter hinweg homogen ist.Moreover, for all the values of δ, the variable parameters VP will each have the same relative position in their respective area, which will be determined by the emotion measure selector 14 here well-balanced change and is homogeneous across the variable parameters.

Natürlich ermöglicht die Ausführungsform viele Varianten, einschließlich: die Anzahl der Parameter P als variable Parameter VP auszubilden. Es kann in Betracht gezogen werden, dass nicht sämtliche N Parameter P gesteuert werden, sondern dass lediglich ein Unter- bzw. Teilsatz eines Parameters oder mehrerer Parameter gesteuert wird, auf den bzw. die durch die Parametererzeugungseinheit 16 für variable Parameter zugegriffen wird; die übrigen Parameter verbleiben bei ihrem Standardwert;
der Auswahl der Formel (1), sowohl hinsichtlich ihrer Form als auch hinsichtlich der Werte. Die Wahl von Konstanten Ei und Eimax in der Formel (1) ist insofern von Vorteil, als Ei bereits von vornherein bekannt ist und als Eimax einfach der experimentell bestimmte Wert ist, was die Realisierung stark vereinfacht. Andere Rechenoperationen unter Heranziehung dieser Werte oder anderer Werte können indessen in Betracht gezogen werden. So kann die Formel (1) beispielsweise angepasst werden, um einen Eimin-Wert aufzunehmen, der unabhängig bestimmt ist und der nicht dem Wert von Eimax untergeordnet ist. In diesem Fall kann die Formel (1) neu ausgedrückt werden als: VPi = EI + δ(Eimin + Ei) (1')
Of course, the embodiment allows many variations including: forming the number of parameters P as variable parameters VP. It may be considered that not all N parameters P are controlled, but that only one subset of one or more parameters is controlled by the parameter generation unit 16 for variable parameters is accessed; the remaining parameters remain at their default value;
the choice of formula (1), both in terms of their form and in terms of values. The choice of constant Ei and Eimax in the formula (1) is advantageous in that egg is already known from the outset and as Eimax is simply the experimentally determined value, which greatly simplifies the realization. Other computational operations using these values or other values may, however, be considered. For example, formula (1) may be adjusted to accommodate an Eimin value that is independently determined and that is not subordinate to the value of Eimax. In this case, formula (1) can be reworded as: VPi = EI + δ (Eimin + Ei) (1 ')

Der Wert von Eimin kann für jeden Parameter experimentell bestimmt sein, um in einer analogen Weise variabel gemacht zu werden, wie dies oben beschrieben worden ist: Eimin wird als derjenige Wert bezeichnet, der zum niedrigsten brauchbaren Emotionsmaß führt, unterhalb dessen entweder keine praktisch nutzbare Absenkung der Emotionsintensität oder eine Entstellung des Emotionstyps vorliegen. Der Speicher wird dann die Werte Eimin anstelle von Eimax speichern.Of the Value of Eimin can be for each parameter must be determined experimentally to be in an analogue Way to be made variable as described above is: Eimin is referred to as the lowest value useful emotional dimension, below of which either no practically usable reduction in emotional intensity or a Disfigurement of the emotion type present. The memory will be the Save values Eimin instead of Eimax.

Außerdem kann der Mittelbereichswert ein Wert sein, der verschieden ist vom Standardwert Ei;
der Wahl des Steuerungswertes δ und seines Intervalls, wie dies oben erörtert wurde. Außerdem können andere komplexere Varianten in Betracht gezogen werden, die mehr als eine steuerbare Variable nutzen;
der Wahl des Emotions-Simulationsalgorithmus, wie er oben erläutert wurde. In der Tat dürfte einzusehen sein, dass die Lehren der Erfindung hinsichtlich der Emotions-Simulationsalgorithmen ziemlich universell sind. Diese Lehren können auch entsprechend für andere Simulationssysteme in Betracht gezogen werden,
beispielsweise zur Erzeugung einer Variabilität für Parameter, die Gesichtsaudrücke bestimmen, um Sprache, Emotionen, etc. auszudrücken.
In addition, the mid-range value may be a value different from the default value Ei;
the choice of control value δ and its interval, as discussed above. In addition, other more complex variants may be considered that use more than one controllable variable;
the choice of the emotion simulation algorithm as explained above. In fact, it should be understood that the teachings of the invention are fairly universal in terms of emotion simulation algorithms. These teachings may also be considered as appropriate for other simulation systems,
for example, to create variability for parameters that determine facial expressions to express speech, emotions, etc.

Die oben angegebenen Lehren sind bei sämtlichen Emotionen E anwendbar, die durch Emotions-Simulationsalgorithmen simuliert werden: Ruhe, Glück bzw. Fröhlichkeit, Ärger, Traurigkeit, Ängstlichkeit, etc.The The above teachings are applicable to all emotions E, which are simulated by emotion simulation algorithms: rest, Luck or Happiness, anger, sadness, timidity, Etc.

Es werden nunmehr zwei Beispiele angegeben, um zu veranschaulichen, wie ein Emotions-Simulationsalgorithmussystem eine Größe bzw. ein Maß des Emotions-Änderungssystems 10 nutzen kann, wie dies unter Bezugnahme auf 2 beschrieben ist.Two examples will now be given to illustrate how an emotion simulation algorithm system measures a magnitude of the emotion change system 10 can use, as with reference to 2 is described.

Beispiel 1: Ein Roboter-Tier, welches imstande ist, modulierte Klänge zum Ausdruck zu bringen, die durch einen Sprachsynthesizer erzeugt werden, der eine Reihe von Eingangsparametern enthält, die einen durch die Sprache auszudrückenden Emotionszustand festlegen.example 1: A robot animal capable of modulating sounds to Expressing that are generated by a speech synthesizer, which contains a number of input parameters, one through the language be expressed Set emotion state.

Das Beispiel basiert auf dem Inhalt der früher veröffentlichten Anmeldung EP-A-1.256.931 der Anmelderin, eingereicht am 11. Mai 2001 "Method and apparatus for voice synthesis and robot apparatus", von der die Priorität beansprucht wird.The example is based on the content of the earlier published application EP-A-1256931 by the applicant, filed on 11 May 2001, entitled 'Method and apparatus for voice synthesis and robot apparatus', claiming priority.

Der Emotions-Synthesealgorithmus basiert auf der Vorstellung, dass eine Emotion in einem Merkmalsraum ausgedrückt werden kann, der aus einer Erregungskomponente und einer Valenzkomponente besteht. So werden beispielsweise Ärger, Traurigkeit, Fröhlichkeit und Behaglichkeit in besonderen Regionen innerhalb des Erregungs-Valenz-Merkmalraumes dargestellt.Of the Emotions synthesis algorithm is based on the idea that one Emotion can be expressed in a feature space that consists of a Excitation component and a valence component. So be for example, trouble, Sadness, happiness and cosiness in particular regions within the excitation valence trait space shown.

Der Algorithmus bezieht sich auf Tabellen, die einen Satz von Parametern P repräsentieren, welche zumindest die Dauer (DUR), die Tonhöhe (PITCH) und den Klang (VOLUME) eines vorab für jede Grundemotion definierten Phonems enthalten. Diese Parameter sind numerische Werte oder Zustände (wie "Anstieg" oder "Abfall"). Diese Zustandsparameter können pro Standardeinstellung aufrechterhalten werden, und sie können nicht durch das Maß des Emotions-Änderungssystems 10 gesteuert werden.The algorithm refers to tables representing a set of parameters P which include at least the duration (DUR), the pitch (PITCH) and the sound (VOLUME) of a phoneme defined in advance for each basic emotion. These parameters are numeric values or states (such as "rise" or "fall"). These state parameters can be maintained per default, and they can not be adjusted by the level of the emotion change system 10 to be controlled.

Die nachstehende Tabelle I zeigt ein Beispiel der Parameter und ihrer beigefügten Werte für die Emotion "Fröhlichkeit". Die genannten Parameter gelten für unverständliche Wörter einer oder einiger Silben oder Phoneme, die u. a. hinsichtlich Tonhöhencharakteristiken, Dauer, Kontur, Lautstärke, etc. in anerkannten Einheiten spezifiziert sind. Diese Charakteristiken sind in einer formatierten Datenstruktur ausgedrückt, die durch den Algorithmus erkannt wird. Tabelle I: Parametereinstellungen für die Emotion "Fröhlichkeit" Charakteristik Parameter numerischer Wert oder Zustand letztes Wort betont richtig mittlere Tonhöhe 400 Hz Tonhöhenänderung 100 Hz maximale Tonhöhe 600 Hz mittlere Dauer 170 ms Dauer-Änderung 50 ms Wahrscheinlichkeit der 0,3 (30%) Betonung eines Worts Standard-Kontur ansteigend Kontur des letzten Wortes ansteigend Lautstärke 2 (spezifische Einheiten) Table I below shows an example of the parameters and their attached values for the emotion "cheerfulness". The mentioned parameters are valid for incomprehensible words of one or several syllables or Phonemes that are specified in terms of pitch characteristics, duration, contour, volume, etc. in recognized units. These characteristics are expressed in a formatted data structure recognized by the algorithm. Table I: Parameter settings for the emotion "happiness" characteristics parameter numeric value or state emphasizes last word right middle pitch 400 Hz pitch change 100 Hz maximum pitch 600 Hz medium duration 170 ms Time change 50 ms Probability of 0.3 (30%) Emphasis on a word Standard contour sloping Contour of the last word sloping volume 2 (specific units)

Unterschiedliche Emotionen werden ihre eigenen Parameterwerte oder -zustände für dieselben Charakteristiken aufweisen.different Emotions become their own parameter values or states for the same Have characteristics.

Das Roboter-Tier, in welches dieser Algorithmus einbezogen ist, ist so gestaltet, dass es von einem Satz von Parameterwerten zu einem anderen Satz von Parameterwerten auf die Entscheidung hin umschaltet, die Emotion darzustellen.The Robot animal in which this algorithm is involved is designed to make it from one set of parameter values to one other set of parameter values switches to the decision, the To represent emotion.

In diesem Fall sind die Parameter der Charakteristiken in der Tabelle I, die numerische Werte aufweisen, nicht länger für bzw. auf eine bestimmte Emotion festgelegt, sondern sie werden variable Parameter VP unter Heranziehung des Maßes des Emotions-Änderungssystems 10.In this case, the parameters of the characteristics in the table I having numerical values are no longer fixed to a particular emotion, but they become variable parameters VP by using the measure of the emotion changing system 10 ,

Im Falle beispielsweise der mittleren Tonhöhencharakteristik für die Emotion "Fröhlichkeit" wird der Standard-Parameterwert von 400 Hz der Wert Ei in der Gleichung (1) für den betreffenden Parameter. Es wird ein Schritt zur Bestimmung i) der Richtung (Zunahme/Abnahme) ausgeführt, in der dieser Wert modifiziert werden kann, um eine intensivere Darstellung der Fröhlichkeit zu erzeugen. Sodann wird ein Schritt ii) ausgeführt, um zu bestimmen, wie weit in der betreffenden Richtung dieser Parameter geändert werden kann, um diese Intensität brauchbar zu steigern. Dieser Grenzwert ist Eimax in der Gleichung (1). Auf diese Weise wird die gesamte notwendige Information zur Erzeugung der Variabilitätsskala für den variablen Parameter VPi der betreffenden Charakteristik erzielt. Dieselbe Prozedur wird für alle übrigen Charakteristiken angewandt, bezüglich der entschieden wird, den Parameter durch das Maß bzw. die Größe des Emotion-Änderungssystems 10 zu einem variablen Parameter VP zu machen.For example, in the case of the mean pitch characteristic for the "cheerfulness" emotion, the default parameter value of 400 Hz becomes the value Ei in equation (1) for that parameter. A step is performed for determining i) the direction (increase / decrease) in which this value can be modified to produce a more intense representation of happiness. Then, a step ii) is performed to determine how far in the direction in question that parameter can be changed to usefully increase that intensity. This limit is Eimax in equation (1). In this way, all the necessary information for generating the variability scale for the variable parameter VPi of the characteristic in question is obtained. The same procedure is used for all other characteristics with which it is decided to set the parameter by the size of the emotion change system 10 to make a variable parameter VP.

Beispiel 2: Ein System, welches imstande ist, einen Emotionsinhalt zu eintreffenden Sprachdaten entsprechend verständlichen Wörtern oder unverständlichen Klängen in einem neutralen Ton hinzuzufügen, so dass die hinzugefügte Emotion empfunden werden kann, wenn die so verarbeiteten Sprachdaten abgespielt bzw. wiedergegeben werden.example 2: A system capable of arriving at an emotion content Speech data understandable accordingly words or incomprehensible sounds to add in a neutral tone, so the added Emotion can be felt when the thus processed voice data be played or played back.

Das Beispiel basiert auf dem Inhalt der früher veröffentlichen Anmeldung EP-A-1.256.932 der Anmelderin, eingereicht am 13. Juli 2001 "Method and apparatus for synthesising an emotion conveyed an a sound", von der die Priorität beansprucht ist.The example is based on the content of the earlier published application EP-A-1256932 by the applicant, filed on 13 July 2001, "Method and apparatus for synthesizing an emotion conveyed to a sound", from which the priority is claimed.

Das System umfasst ein Emotions-Simulationsalgorithmussystem, welches wie im Falle der 1 einen Eingang zur Aufnahme von Klangdaten und einen Ausgang zur Abgabe von Klandaten im selben Format aufweist, allerdings mit modifizierten Datenwerten entsprechend der auszudrückenden Emotion. Das System kann somit effektiv längs einer Kette zwischen einer Schalldatenquelle und einem Schalldaten-Abspielgerät, wie einem Interpolator zuzüglich eines Synthesizers in einer vollständig transparenten Weise angeordnet sein.The system includes an emotion simulation algorithm system which, as in the case of 1 has an input for recording sound data and an output for outputting landforms in the same format, but with modified data values corresponding to the emotion to be expressed. The system may thus be effectively arranged along a chain between a sound data source and a sound data player, such as an interpolator plus a synthesizer, in a completely transparent manner.

Die Modifikation der Datenwerte wird durch Operatoren ausgeführt, die auf die zu modifizierenden Werte einwirken. In typischer Weise liegen die Schalldaten vor in Form von aufeinander folgenden Datenelementen, deren jedes einem Schall- bzw. Klangelement, beispielsweise einer Silbe oder einem Phonem entspricht, die bzw. das durch einen Synthesizer wiederzugeben ist. Ein Datenelement spezifiziert beispielsweise die Dauer des Schallelements und einen Tonhöhenwert oder mehrere Tonhöhenwerte, die über diese Dauer vorhanden sind. Das Datenelement kann außerdem die wiederzugebende Silbe kennzeichnen, und es kann eine Anzeige darüber zugeordnet sein, ob das Datenelement betont werden kann oder nicht. So kann beispielsweise ein Datenelement für die Silbe "be" folgende Datenstruktur besitzen: "be": 100, P1, P2; P3, P4, P5". Die erste Zahl 100 drückt die Dauer in Millisekunden aus. Die folgenden fünf Werte (symbolisiert durch P1–P5) geben den Tonhöhenwert (F0) in fünf entsprechenden und aufeinander folgenden Intervallen während der betreffenden Dauer an.The modification of the data values is performed by operators which are to be modified Influence values. Typically, the sound data is in the form of successive data elements, each of which corresponds to a sound element, such as a syllable or a phoneme, to be reproduced by a synthesizer. For example, a data item specifies the duration of the beat element and a pitch value or multiple pitch values that are present over that duration. The data element may also identify the syllable to be played, and an indication may be associated with whether the data element can be emphasized or not. For example, a data element for the syllable "be" may have the following data structure: "be": 100, P1, P2; P3, P4, P5 "The first number 100 expresses the duration in milliseconds The following five values (symbolized by P1-P5) indicate the pitch value (F0) at five corresponding and successive intervals during the duration in question.

Unterschiedliche Arten bzw. Typen möglicher Operatoren des Systems rufen unterschiedliche Modifikationen bezüglich der Datenelemente hervor, bei denen sie angewandt werden.different Types or types of possible Operators of the system call different modifications regarding the Data elements to which they are applied.

3 veranschaulicht in einem Blockdiagramm in funktionellen Begriffen, wie das Emotions-Simulationsalgorithmussystem mit dem obigen Emotions-Synthesizer 26 integriert ist, um in der Intensität variable emotionsbetonte Sprachdaten zu erzeugen. 3 illustrates in a block diagram in functional terms, such as the emotion simulation algorithm system with the above emotion synthesizer 26 is integrated to produce variable emotion-weighted speech data in intensity.

Das Emotions-Simulationsalgorithmussystem 12 arbeitet durch selektive Anwendung der Operatoren O auf die Silbendaten, die aus einer Stimmgebungs-Datendatei 28 ausgelesen sind. In Abhängigkeit von ihrem Typ können diese Operatoren entweder die Tonhöhendaten (Tonhöhen-Operator) oder die Silbendauer-Daten (Dauer-Operator) modifizieren. Diese Modifikationen finden vor einem Interpolator 30 statt, beispielsweise vor einem Sprachdaten-Decoder 32, so dass die Interpolation bezüglich der Operator-modifizierten Werte ausgeführt wird. Wie unten erläutert, wird die Modifikation so vorgenommen, dass selektiv eine neutrale Form von Sprache selektiv in eine Sprache transformiert wird, die eine gewählte Emotion (Traurigkeit, Ruhe, Fröhlichkeit, Ärger) in einem gewählten Ausmaß ausdrückt.The emotion simulation algorithm system 12 works by selectively applying the operators O to the syllable data resulting from a mood data file 28 are read out. Depending on their type, these operators can modify either the pitch data (pitch operator) or the syllable duration (duration operator) data. These modifications take place before an interpolator 30 instead of, for example, a voice data decoder 32 so that the interpolation with respect to the operator-modified values is carried out. As explained below, the modification is made to selectively transform a neutral form of speech selectively into a language that expresses a selected emotion (sadness, calm, happiness, anger) to a selected extent.

Die Grundoperatorformen sind in einer Operatorsatz-Bibliothek 34 gespeichert, in die auf sie selektiv durch eine Operatorsatz-Konfigurationseinheit 36 zugegriffen werden kann. Die letztgenannte Einheit dient dazu, die Operatoren in Übereinstimmung mit gegenwärtigen Anforderungen zu erstellen und zu parametrisieren. Zu diesem Zweck ist eine Operator-Parametrisierungseinheit 38 vorgesehen, welche die Parametrisierung der Operatoren bestimmt, und zwar in Übereinstimmung mit: i) der der Sprache aufzudrückenden Emotion (Ruhe, Traurigkeit, Fröhlichkeit, Ärger, etc.), ii) dem Ausmaß – oder der Intensität – der auszuübenden Emotion, und iii) dem Kontext der Silbe, wie dies unten erläutert wird. Zur Realisierung der Ausführungsform gemäß 2 sind in die Operations-Parametrisierungseinheit 38 die Parametererzeugungseinheit 16 für variable Parameter und der Speicher 14 des Emotionsmaß-Änderungssystems 10 einbezogen.The basic operator forms are in an operator set library 34 stored in the on it selectively by an operator set configuration unit 36 can be accessed. The latter unit serves to create and parameterize the operators in accordance with current requirements. For this purpose, an operator parameterization unit 38 which determines the parameterization of the operators, in accordance with: i) the emotion to be expressed in language (rest, sadness, happiness, anger, etc.), ii) the extent - or intensity - of the emotion to be exercised, and iii ) the context of the syllable, as explained below. For the realization of the embodiment according to 2 are in the operations parameterization unit 38 the parameter generation unit 16 for variable parameters and the memory 14 of the emotion measure change system 10 included.

Die Emotion und der Emotionsgrad werden der Operator-Parametrisierungseinheit 38 durch ein Emotionsauswahl-Interface 40 per Befehl zugeführt, welches Eingangssignale darstellt, die für einen Benutzer U zugreifbar sind. Für die Realisierung der Ausführungsform ist in dieses Benutzer-Interface die Emotionsmaß-Auswahleinrichtung 18 (siehe 2) einbezogen, wobei der Zeiger 22 eine durch einen Benutzer verschiebbare physikalische oder elektronische Vorrichtung ist. Unter den von der Interfaceeinheit 40 abgegebenen Befehlen wird demgemäß die Variable δ sein. Das Emotionsauswahl-Interface 40 kann in Form einer Computer-Schnittstelle mit Menüs und Symbolen auf einem Anzeigebildschirm vorliegen, die es dem Benutzer U ermöglichen, alle notwendigen Emotionscharakteristiken sowie andere Betriebsparameter anzuzeigen.The emotion and the degree of emotion become the operator parameterization unit 38 through an emotion selection interface 40 supplied by command representing input signals accessible to a user U. For implementation of the embodiment, the emotion measurement device is included in this user interface 18 (please refer 2 ), the pointer 22 is a user-displaceable physical or electronic device. Among those of the interface unit 40 Accordingly, given instructions will be the variable δ. The emotion selection interface 40 may be in the form of a computer interface with menus and icons on a display screen that allow the user U to display all the necessary emotion characteristics as well as other operating parameters.

Bei dem Beispiel ist der Kontext der Silbe, die Operator-empfindlich ist, gegeben durch: i) die Position der Silbe in einem Ausdruck bzw. einem Satz, wenn einige Operatorsätze lediglich auf die ersten und letzten Silben des Ausdrucks bzw. des Satzes angewandt werden, ii) ob die Silbe sich auf verständliche Wortsätze oder auf unverständliche Klänge (Murmeln, etc.) bezieht, und iii) ob ggf. einer berücksichtigten Silbe erlaubt ist, betont zu werden oder nicht, wie dies in der Stimmgebungs-Datendatei 28 angegeben ist.In the example, the context of the syllable that is operator-sensitive is given by: i) the position of the syllable in an expression or phrase when some operator sets are applied to only the first and last syllables of the phrase or sentence ii) whether the syllable refers to understandable phrases or unintelligible sounds (marbles, etc.), and iii) whether or not a given syllable is allowed to be emphasized or not, as in the mood data file 28 is specified.

Zu diesem Zweck sind eine Identifizierungseinheit 42 für erste und letzte Silben und eine Betonungs-Detektiereinheit 44 für autorisierte Silben vorgesehen, wobei beide Einheiten einen Zugriff auf die Stimmgebungs-Datendateieinheit 28 besitzen und die Operator-Parametrisierungseinheit 38 bezüglich der geeigneten Kontext-empfindlichen Parameter informieren.For this purpose, an identification unit 42 for first and last syllables and an emphasis detection unit 44 for authorized syllables, with both units accessing the mood data file unit 28 own and the operator parameterization unit 38 inform about the appropriate context-sensitive parameters.

Wie weiter unten im Einzelnen erläutert, gibt es Operatorsätze, die speziell bei Silben anwendbar werden, welche zu betonen sind ("betonbare" Silben). Diese Operatoren werden nicht systematisch bei sämtlichen betonbaren Silben angewandt, sondern lediglich bei solchen, die aus Kandidaten-Silben durch eine Zufallsauswahl ausgewählt sind. Die Kandidaten-Silben hängen von den Stimmgebungsdaten ab. Falls letztere Anzeigen dafür enthalten, welchen Silben ermöglicht ist, betont zu werden, dann werden die Kandidaten-Silben lediglich aus jenen betonbaren Silben herausgenommen.As explained in detail below, there are operator sets that are especially applicable to syllables that are to be emphasized ("conspicuous" syllables). These operators are not systematically applied to all conspicuous syllables, but only to those that are randomly selected from candidate syllables selection are selected. The candidate syllables depend on the mood data. If the latter contain indications of which syllables are allowed to be emphasized, then the candidate syllables are merely taken out of those conspicuous syllables.

Dies wird üblicherweise der Fall sein für verständliche Texte, in denen die Betonung von einigen Silben verboten ist, um eine natürliche Klangwiedergabe sicherzustellen. Falls die Stimmgebungs-Bibliothek derartige Anzeigen bzw. Hinweise nicht enthält, dann stellen sämtliche Silben Kandidaten für die Zufallsauswahl dar. Dies wird üblicherweise für unverständliche Klänge der Fall sein.This becomes common be the case for understandable Texts in which the emphasis on a few syllables is forbidden a natural one Ensure sound reproduction. If the mood library does not contain such ads or instructions, then put all Syllables candidates for random selection. This is usually incomprehensible sounds be the case.

Die Zufallsauswahl wird durch eine Zufallsentnahmeeinheit 46 mit steuerbarer Wahrscheinlichkeit vorgenommen, wobei die betreffende Einheit betriebsmäßig zwischen der Betonungseinheit 44 für autorisierte Silben und der Operator-Parametrisierungseinheit 38 angeschlossen ist. Die Zufallsentnahmeeinheit 46 besitzt ein steuerbares Maß an Wahrscheinlichkeit bezüglich der Auswahl einer Silbe aus den Kandidaten. Genauer gesagt sollen in dem Fall, dass N die Wahrscheinlichkeit dafür ist, dass ein Kandidat ausgewählt wird, wobei N steuerbar von 0 bis 1 reicht, sodann für P Kandidaten-Silben N. P Silben im Mittel ausgewählt werden, um einem spezifischen Operatorsatz ausgesetzt zu werden, der einer Zufallsbetonung zugehörig ist. Die Verteilung der zufällig ausgewählten Kandidaten ist im Wesentlichen gleichförmig über die Folge der Silben.The random selection is made by a random sampling unit 46 with controllable probability, with the unit in question operatively between the accent unit 44 for authorized syllables and the operator parameterization unit 38 connected. The random sampling unit 46 has a controllable degree of probability of choosing a syllable from the candidates. More specifically, in the event that N is the probability that a candidate is selected, with N controllably ranging from 0 to 1, then for P candidate syllables N.P syllables on average should be selected to be exposed to a specific set of operators which belongs to a random stress. The distribution of the randomly selected candidates is substantially uniform over the sequence of syllables.

Die geeignet konfigurierten Operatorsätze von der Operatorsatz-Konfigurationseinheit 26 werden zu einer Silbendaten-Modifiziereinheit 48 übertragen, in der sie auf die Silbendaten angewandt werden. Zu diesem Zweck empfängt die Silbendaten-Modifiziereinheit 48 die Silbendaten direkt von der Stimmgebungs-Datendatei 28. Die so empfangenen Silbendaten werden durch die Einheit 48 als Funktion des Operatorsatzes modifiziert, insbesondere hinsichtlich der Tonhöhen- und Dauer-Daten. Die resultierenden modifizierten Silbendaten (neue Silbendaten) werden dann von der Silbendaten-Modifiziereinheit 48 an den Decoder 32 abgegeben, und zwar mit derselben Struktur wie sie in der Stimmgebungs-Datendatei vorhanden ist. Auf diese Weise kann der Decoder die neuen Silbendaten exakt verarbeiten, als wenn sie direkt aus der Stimmgebungs-Datendatei stammten. Von dort werden die neuen Silbendaten interpoliert (Interpolatoreinheit 30) und durch einen Audiofrequenz-Klangprozessor, einen Audioverstärker und Lautsprecher verarbeitet. Der durch den Lautsprecher erzeugte Klang entspricht jedoch nicht mehr einem neutralen Ton, sondern er entspricht vielmehr dem Klang mit einer Simulation einer Emotion, die durch den Benutzer U bestimmt bzw. definiert ist.The appropriately configured operator sets from the operator set configuration unit 26 become a syllable data modifier unit 48 in which they are applied to the syllable data. For this purpose, the syllable data modifier unit receives 48 the syllable data directly from the mood data file 28 , The thus received syllable data is passed through the unit 48 modified as a function of the operator set, in particular with regard to the pitch and duration data. The resulting modified syllable data (new syllable data) is then received by the syllable data modifier unit 48 to the decoder 32 with the same structure as in the mood data file. In this way, the decoder can accurately process the new syllable data as if it originated directly from the vocalization data file. From there, the new syllable data are interpolated (interpolator unit 30 ) and processed by an audio frequency sound processor, an audio amplifier and speakers. However, the sound produced by the speaker no longer corresponds to a neutral tone, but rather corresponds to the sound with a simulation of an emotion determined by the user U.

Sämtliche obigen funktionalen Einheiten stehen unter der Gesamtsteuerung einer Operations-Folgesteuereinheit 50, die die gesamte Ausführung der Emotionserzeugungsprozedur entsprechend einem vorgeschriebenen Satz von Regeln leitet.All the above functional units are under the overall control of an operation sequencer 50 which directs the entire execution of the emotion generation procedure according to a prescribed set of rules.

4 veranschaulicht grafisch den Effekt des Tonhöhen-Operatorsatzes OP auf eine Tonhöhenkurve eines synthetisierten Klangelements, welches ursprünglich durch seine Klangdaten spezifiziert ist. Für jeden Operator zeigt die Figur – jeweils in linken und rechten Spalten – eine Tonhöhenkurve (Grundfrequenz f in Abhängigkeit von der Zeit t) vor der Wirkung des Tonhöhen-Operators und nach der Wirkung eines Tonhöhen-Operators. Bei dem Beispiel sind die Eingangs-Tonhöhenkurven für sämtliche Operatoren identisch und sie erscheinen relativ flach. 4 graphically illustrates the effect of the pitch operator set OP on a pitch curve of a synthesized clipping element originally specified by its sound data. For each operator, the figure shows a pitch curve (fundamental frequency f as a function of time t) - in left and right columns, respectively - before the effect of the pitch operator and after the action of a pitch operator. In the example, the input pitch curves are identical for all operators and they appear relatively flat.

Es gibt in dem dargestellten Satz vier Operatoren, und zwar folgende (von oben nach unten in der Figur):
einen Tonhöhen-Operator OPrs mit "ansteigendem Kurvenverlauf", der jeder eingangsseitigen Tonhöhen-Kurve einen Kurvenverlauf auferlegt, welcher in der Zeit ansteigt, d. h. der betreffende Operator bewirkt, dass die ursprüngliche Tonhöhen-Kontur in der Frequenz über die Zeit ansteigt;
einen Tonhöhen-Operator OPfs mit einem "abfallenden Kurvenverlauf", der jeder eingangsseitigen Tonhöhen-Kurve einen Kurvenverlauf auferlegt, welcher in der Zeit abfällt, d. h., der betreffende Operator bewirkt, dass die ursprüngliche Tonhöhen-Kontur über die Zeit in der Frequenz absinkt;
einen Tonhöhen-Operator OPsu mit einer "Aufwärtsverschiebung", der jeder eingangsseitigen Tonhöhen-Kurve eine gleichmäßige Aufwärtsverschiebung in der Grundfrequenz auferlegt, wobei die Verschiebung für sämtliche Punkte in der Zeit gleich ist, so dass die Tonhöhen-Kontur einfach auf der Grundfrequenzachse nach oben geschoben wird; und
einen Tonhöhen-Operator OPsd für eine "Abwärtsverschiebung", der jeder eingangsseitigen Tonhöhen-Kurve eine gleichmäßige Abwärtsverschiebung in der Grundfrequenz auferlegt, wobei die Verschiebung für sämtliche Punkte in der Zeit gleich ist, so dass die Tonhöhen-Kontur einfach auf der Grundfrequenzachse nach unten verschoben ist.
There are four operators in the illustrated sentence, the following ones (from top to bottom in the figure):
an "ascending waveform" pitch operator OPrs which imposes a waveform on each input-side pitch curve, which increases in time, ie, the operator concerned causes the original pitch contour to increase in frequency over time;
a pitch operator OPfs having a "falling waveform" which imposes a waveform on each input pitch curve, which decays in time, ie, the operator concerned causes the original pitch contour to decrease in frequency over time;
a pitch operator OPsu with an "upward shift" which imposes a uniform upward shift in the fundamental frequency on each input pitch curve, the shift being equal for all points in time so that the pitch contour is simply shifted up on the fundamental frequency axis becomes; and
a "downshift" pitch operator OPsd which imposes a uniform downward shift in the fundamental frequency on each input pitch curve, the shift being the same for all points in time so that the pitch contour is simply shifted down on the fundamental frequency axis is.

Bei der Ausführungsform weisen die Operatoren OPrs für den ansteigenden Kurvenverlauf und OPfs für den abfallenden Kurvenverlauf die folgende Charakteristik auf: Die Tonhöhe im mittleren Punkt zur Zeit (1/2 t1 für eine Tonhöhendauer von t1) bleibt im Wesentlichen unverändert nach dem Operator bzw. nach dessen Einwirken. Mit anderen Worten ausgedrückt heißt dies, dass die Operatoren so wirken, dass die Eingangs-Tonhöhenkurve um den Tonhöhenwert am zentralen Zeitpunkt geschwenkt wird, um den geforderten Kurvenverlauf bzw. die geforderte Neigung aufzuerlegen. Dies bedeutet, dass im Falle des Operators OPrs mit ansteigendem Kurvenverlauf die Tonhöhenwerte vor dem zentralen Zeitpunkt tatsächlich abgesenkt sind und dass im Falle eines Operators OPfs mit abfallendem Kurvenverlauf die Tonhöhenwerte vor dem zentralen Zeitpunkt tatsächlich angehoben sind, wie dies durch die Figur veranschaulicht ist.In the embodiment, the operators OPrs for the rising waveform and OPfs for the falling curve the following characteristic: The pitch in the middle point at the time (1/2 t1 for a pitch duration of t1) remains essentially unchanged after the operator or after its action. In other words, the operators operate to panning the input pitch curve by the pitch value at the central point in time to impose the required curve or slope. That is, in the case of the rising-waveform operator OPrs, the pitch values before the central timing are actually lowered and, in the case of a falling-waveform operator OPfs, the pitch values before the central timing are actually raised, as illustrated by the figure.

Optional können auch Intensitäts-Operatoren, die mit OI bezeichnet sind, vorgesehen sein. Die Auswirkungen dieser Operatoren sind in 5 veranschaulicht, die der Darstellung von 4 direkt analog ist. Diese Operatoren betragen ebenfalls vier in der Anzahl, und sie sind identisch mit jenen der Tonhöhen-Operatoren OP, allerdings mit der Ausnahme, dass sie auf die Kurve der Intensität I über die Zeit t einwirken. Demgemäß sollen diese Operatoren der Einfachheit halber nicht detailliert gesondert betrachtet werden.Optionally, intensity operators labeled OI may also be provided. The effects of these operators are in 5 illustrates the appearance of 4 is directly analog. These operators are also four in number, and are identical to those of the pitch operators OP, except that they act on the intensity I curve over time t. Accordingly, these operators should not be considered separately in detail for the sake of simplicity.

Die Tonhöhen- und Intensitäts-Operatoren können jeweils wie folgt parametrisiert werden:
Für die ansteigenden und abfallenden Operatoren (OPrs, OPfs, OIrs, OIfs): Der Gradient der Steigung bzw. Neigung, die der Eingangskontur aufzuerlegen ist. Die Steigung bzw. Neigung kann ausgedrückt werden in Begriffen von normierten Steigungs- bzw. Neigungswerten. So entspricht beispielsweise 0, dass keine Steigung bzw. Neigung auferlegt wird; der Operator hat in dem Fall keine Auswirkung auf das Eingangssignal (ein derartiger Operator wird als neutralisierter oder neutraler Operator bezeichnet). Beim anderen Extrem bewirkt ein maximaler Wert, dass die Eingangskurve einen unendlichen Gradienten aufweist, d. h. nahezu vertikal ansteigt oder abfällt. Zwischen diesen Extremen kann ein beliebiger Parameterwert dem fraglichen Operator zugeordnet werden, um die geforderte Steigung bzw. Neigung der Eingangskontur aufzuerlegen.
The pitch and intensity operators can each be parameterized as follows:
For the rising and falling operators (OPrs, OPfs, OIrs, OIfs): The gradient of the slope to be imposed on the input contour. The slope may be expressed in terms of normalized slope values. For example, 0 means that no slope is imposed; the operator has no effect on the input signal in this case (such an operator is called a neutralized or neutral operator). At the other extreme, a maximum value causes the input curve to have an infinite gradient, ie, to rise or fall almost vertically. Between these extremes, any parameter value may be assigned to the operator in question to impose the required slope of the input contour.

Für die Verschiebeoperatoren (OPsu, OPsd, OIsu, OIsd): Der Betrag der Aufwärts- oder Abwärtsverschiebung, die der Eingangskontur auferlegt wird, hinsichtlich der absoluten Grundfrequenz (für die Tonhöhe) oder des Intensitätswertes. Die entsprechenden Parameter können somit in Einheitsinkrementen oder -dekrementen längs der Tonhöhen- oder Intensitätsachse ausgedrückt werden.For the shift operators (OPsu, OPsd, OIsu, OIsd): The amount of upward or downward shift that the input contour with respect to the absolute fundamental frequency (for the pitch) or of the intensity value. The corresponding parameters can thus in unit increments or decrements along the pitch or intensity axis expressed become.

6 veranschaulicht grafisch die Auswirkung eines Dauer-(oder Zeit-)-Operators OD auf eine Silbe. Die Darstellung veranschaulicht in linken und rechten Spalten die Dauer der Silbe (in einer horizontalen Zeile, die eine Anfangszeitlänge t1 ausdrückt) der Eingangssilbe vor der Wirkung eines Dauer-Operators bzw. nach der Wirkung eines Dauer-Operators. 6 graphically illustrates the effect of a continuous (or time) operator OD on a syllable. The illustration illustrates in left and right columns the duration of the syllable (in a horizontal line expressing an initial time length t1) of the input syllable before the action of a persistent operator or after the action of a persistent operator.

Der Dauer-Operator kann sein:
ein Dehnungs-Operator, der bewirkt, dass die Dauer der Silbe vergrößert wird. Die Vergrößerung wird in Begriffen eines Parameters D ausgedrückt, der als positiver D-Parameter bezeichnet wird. Der Parameter D kann beispielsweise einfach eine Anzahl von Millisekunden einer Dauer sein, um diese dem anfänglichen Eingangs-Dauer-Wert hinzuzuaddieren, falls letzterer ebenfalls in Millisekunden ausgedrückt ist, so dass die Wirkung des Operators einfach dadurch erhalten wird, dass der Wert D zu der Dauer-Spezifikation t1 für die fragliche Silbe hinzuaddiert wird. Als Ergebnis wird die Verarbeitung der Daten durch den Interpolator 30 und folgende Einheiten bewirken, dass die Zeitspanne, über die die Silbe ausgesprochen wird, gestreckt wird;
ein Schrumpfungs-Operator, der bewirkt, dass die Dauer der Silbe zu verringern ist. Die Verringerung wird in Begriffen desselben Parameters D ausgedrückt, der in diesem Fall ein negativer Parameter ist. Der Parameter D kann beispielsweise einfach eine Anzahl von Millisekunden der Dauer sein, um von dem anfänglichen Eingangs-Dauer-Wert subtrahiert zu werden, falls letzterer ebenfalls in Millisekunden ausgedrückt ist, so dass die Wirkung des Operators einfach dadurch erzielt wird, dass der Wert D von der Dauer-Spezifikation für die fragliche Silbe subtrahiert wird. Als Ergebnis bewirkt die Verarbeitung der Daten durch den Interpolator 30 und durch folgende Einheiten, dass die Zeitspanne, über die die Silbe ausgesprochen wird, geschrumpft (gekürzt) wird.
The duration operator can be:
a stretch operator that causes the duration of the syllable to increase. The magnification is expressed in terms of a parameter D, which is called a positive D parameter. For example, the parameter D may simply be a number of milliseconds of duration to add to the initial input duration value, if the latter is also expressed in milliseconds, so that the effect of the operator is obtained simply by adding the value D to the Duration specification t1 is added for the syllable in question. As a result, the processing of the data by the interpolator 30 and subsequent units cause the period of time over which the syllable is expressed to be stretched;
a shrinking operator that causes the duration of the syllable to be reduced. The reduction is expressed in terms of the same parameter D, which in this case is a negative parameter. For example, the parameter D may simply be a number of milliseconds of duration to be subtracted from the initial input duration value, if the latter is also expressed in milliseconds, so that the operator's effect is achieved simply by setting the value D is subtracted from the duration specification for the syllable in question. As a result, the processing of the data by the interpolator causes 30 and by the following units, that the period of time over which the syllable is expressed, shrunk (shortened).

Der Operator kann außerdem ein neutralisierter oder neutral ausgebildeter Operator sein, indem einfach der Wert 0 für den Parameter D eingefügt wird.Of the Operator can as well be a neutralized or neutral operator by simply the value 0 for the parameter D inserted becomes.

Es sei darauf hingewiesen, dass der Dauer-Operator als Operator zweier verschiedener Typen, der Dehnung und der Zusammenziehung, dargestellt worden ist, dass jedoch klar ist, dass der einzige Unterschied im Vorzeichen Plus oder Minus liegt, welches vor den Parameter D gesetzt ist. Somit kann ein und derselbe Operator-Mechanismus beide Operatorfunktionen hervorbringen (Dehnung und Zusammenziehung), falls er positive und negative Zahlen verarbeiten kann.It It should be noted that the duration operator as an operator of two various types of stretching and contraction However, it is clear that the only difference is in the Sign plus or minus, which is set before the parameter D. is. Thus, one and the same operator mechanism can have both operator functions (stretching and contracting), if positive and can process negative numbers.

Der Bereich von möglichen Werten für D und ihrer möglichen inkrementalen Werte in dem Bereich kann entsprechend Anforderungen gewählt werden.Of the Range of possible Values for D and its possible Incremental values in the range may be according to requirements chosen become.

Im Folgenden wird die Parametrisierung jedes der Operatoren OP, OI und OD durch einen variablen Wert ausgedrückt, der durch die letzten Buchstaben des jeweiligen Operators zuzüglich des für den jeweiligen Operator spezifischen Anhangs gekennzeichnet ist, d. h. Prs = der Wert der positiven Steigung für den Tonhöhen-Operator OPrs mit ansteigendem Kurvenverlauf; Pfs = Wert der negativen Steigung für den Tonhöhen-Operator OPfs für den abfallenden Kurvenverlauf; Psu = Wert der Größe der Aufwärtsverschiebung für den Tonhöhen-Operator OPsu mit einer Aufwärtsverschiebung; Psd = Wert des Tonhöhen-Operators OPsd mit einer Abwärtsverschiebung; Irs = Wert der positiven Steigung für den Intensitäts-Operator OIrs mit ansteigendem Kurvenverlauf; Ifs = Wert der negativen Steigung für den Intensitäts-Operator OIfs mit abfallendem Kurvenverlauf; Isu = Wert der Größe der Aufwärtsverschiebung für den Intensitäts-Operator OIsu mit einer Aufwärtsverschiebung; Isd = Wert des Intensitäts-Operators OIsd mit einer Abwärtsverschiebung; Dd = Wert des zeitlichen Inkrements für den Dauer-Dehnungs-Operator ODd; Dc = Wert des zeitlichen Dekrements (Zusammenziehung) für den Dauer-Schrumpfungs-Operator ODc.in the Following is the parameterization of each of the operators OP, OI and OD expressed by a variable value, that by the last Letters of the respective operator plus the one specific to the respective operator Annex is marked, d. H. Prs = the value of the positive slope for the Pitch operator OPrs with rising curve; Pfs = value of the negative slope for the pitch operator OPs for the sloping curve; Psu = value of the size of the upward shift for the pitch operator OPsu with an upward shift; Psd = value of the pitch operator OPsd with a downward shift; Irs = value of the positive slope for the intensity operator OIrs with rising curve; Ifs = value of the negative slope for the Intensity operator OIfs with sloping curve; Isu = value of the size of the upward shift for the Intensity operator OIsu with an upward shift; Isd = value of the intensity operator OIsd with a downward shift; Dd = value of the temporal increment for the duration-stretching operator ODd; Dc = Value of the temporal decrement (contraction) for the duration shrink operator ODc.

Die Ausführungsform verwendet ferner einen gesonderten Operator, der die Wahrscheinlichkeit N für die Zufallsentnahmeeinheit 46 festlegt. Dieser Wert wird aus einem Bereich von 0 (keine Möglichkeit einer Auswahl) bis 1 (Gewissheit der Auswahl) ausgewählt. Der Wert N dient zur Steuerung der Dichte der betonten Silben im ausgesprochenen Ausgangssignal, wie es für die Wiedergabe der emotionalen Qualität geeignet ist.The embodiment also uses a separate operator that has the probability N for the random sampling unit 46 sets. This value is selected from a range of 0 (no possibility of selection) to 1 (certainty of selection). The value N is used to control the density of the accented syllables in the output signal as appropriate for the reproduction of the emotional quality.

Bei dem Beispiel wird jede Auswahl oder eine Auswahl der obigen Werte, die die Operatoren OP, OI, OD und N parametrisieren, für variable Parameter durch die Parametererzeugungseinheit 16 variabel gemacht, die in Verbindung mit dem Speicher 14 und der Emotionsmaß-Auswahleinrichtung 18 arbeitet, wie dies unter Bezugnahme auf 2 beschrieben worden ist. Somit kann ein bestimmter variabler Parameter VPi einem der folgenden oben definierten Parameterwerte entsprechen, um variabel gemacht zu werden: Prs, Pfs, Psu, Psd, Irs, Ifs, Isu, Isd, Dd, Dc. Die Anzahl und Auswahl dieser Werte, die variabel zu machen sind, ist durch das Benutzer-Interface 40 auswählbar.In the example, each selection or a selection of the above values which parameterize the operators OP, OI, OD, and N, for variable parameters by the parameter generation unit 16 made variable in conjunction with the store 14 and the emotion measure selector 18 works like this with reference to 2 has been described. Thus, a particular variable parameter VPi may correspond to one of the following parameter values defined above: Prs, Pfs, Psu, Psd, Irs, Ifs, Isu, Isd, Dd, Dc. The number and selection of these values to be made variable is through the user interface 40 selectable.

7A und 7B bilden ein Ablaufdiagramm, welches den Prozess zur selektiven Bildung und Anwendung der obigen Operatoren auf Silben-Daten auf der Grundlage des unter Bezugnahme auf 3 beschriebenen Systems veranschaulicht. 7B ist eine Fortsetzung der 7A. 7A and 7B FIG. 14 is a flow chart illustrating the process for selectively forming and applying the above operators to syllabic data based on with reference to FIG 3 illustrated system illustrates. 7B is a continuation of 7A ,

Der Prozess beginnt mit einer Initialisierungsphase P1, die das Laden der eingangsseitigen Silben-Daten aus der Stimmgebungs-Datendatei 28 (Schritt S2) einschließt.The process begins with an initialization phase P1, which is the loading of the input-side syllable data from the vocalization data file 28 (Step S2).

Anschließend wird die in den Satz oder die Passage, von der die geladenen Silben-Daten einen Teil bilden, zu übertragende Emotion unter Verwendung der Interfaceeinheit 40 geladen (Schritt S4). Die Emotionen können Ruhe, Traurigkeit, Fröhlichkeit, Ärger, etc. sein. Das Interface gibt außerdem das Maß (den Grad) der bereitzustellenden Emotion ein, beispielsweise durch Beifügung eines Gewichtungswertes (Schritt S6). Dieser Gewichtungswert ist als Auslenkung des variablen Parameterwertes bzw. der variablen Parameterwerte VPi vom Standardwert Pi(=Ei) ausdrückbar, der durch die Variable δ definiert ist, wie dies unter Bezugnahme auf 2 beschrieben worden ist.Then, the emotion to be transmitted into the sentence or passage from which the loaded syllable data is a part is made using the interface unit 40 loaded (step S4). The emotions can be rest, sadness, happiness, anger, etc. The interface also inputs the measure (degree) of the emotion to be provided, for example, by adding a weighting value (step S6). This weighting value can be expressed as a displacement of the variable parameter value or variable parameter values VPi from the standard value Pi (= Ei), which is defined by the variable δ, as described with reference to FIG 2 has been described.

Das System tritt dann in eine universelle Operator-Phase P2 ein, in der ein universeller Operatorsatz OS(U) systematisch auf sämtliche Silben angewandt wird. Der universelle Operatorsatz OS(U) enthält sämtliche Operatoren von 4 und 6, d. h. OPrs, OPfs, OPsu, OPsd, welche die vier Tonhöhen-Operatoren bilden, zuzüglich ODd und ODc, welche die beiden Dauer-Operatoren bilden. Jeder dieser Operatoren des Operatorsatzes OS(U) wird durch einen entsprechend zugehörigen Wert entsprechend Prs(U), Pfs(U), Psu(U), Psd(U), Dd(U) bzw. Dc(U) parametrisiert, wie dies oben erläutert worden ist (Schritt S8). Dieser Schritt schließt die Beifügung von numerischen Werten zu diesen Parametern ein, und er wird durch die Operatorsatz-Konfigurationseinheit 26 ausgeführt. Die Wahl der Parameterwerte für den universellen Operatorsatz OS(U) wird durch die Operator-Parametrisierungseinheit 8 als Funktion der programmierten Emotion und des Maßes der Emotion zuzüglich ggf. anderer Faktoren bestimmt. Bei dem Beispiel soll angenommen werden, dass jeder dieser Parameter durch die Variable δ variabel gemacht wird, wodurch die betreffenden Parameter als VPrs(U), VPfs(U), VPsu(U), VPsd(U), VDd(U) bzw. VDc(U) bezeichnet werden sollen. (Generell ist im Folgenden jeder Parameterwert oder Operator/Operatorsatz, der durch die Variable δ variabel gemacht ist, als solcher durch den Buchstaben "V" gekennzeichnet, der als Anfangsbuchstabe seiner Bezeichnung eingesetzt ist.) Der universelle Operatorsatz VOS(U) wird dann systematisch auf sämtliche Silben eines Satzes oder Satzgliedes oder einer Gruppe von Sätzen bzw. Satzgliedern angewandt (Schritt S10). Die Wirkung schließt eine Modifizierung der numerischen Werte t1, P1–P5 der Silbendaten ein. Für die Tonhöhen-Operatoren wird der Neigungs-Parameter VPrs oder VPfs in eine Gruppe von fünf verschiedenen Werten übersetzt, die arithmetisch auf die Werte P1–P5 anzuwenden sind. Diese Differenzwerte werden so gewählt, dass jeder der Werte P1–P5 entsprechend der parametrisierten Steigung bzw. Neigung verschoben wird, wobei der Mittelwert P3 weitgehend unverändert bleibt, wie dies früher erläutert worden ist. Die ersten beiden Werte der Parameter für die ansteigende Neigung werden beispielsweise negativ sein, um zu bewirken, dass die erste Hälfte der Tonhöhe abzusenken ist, und die letzten beiden Werte werden positiv sein, um zu bewirken, dass die letzte Hälfte der Tonhöhe angehoben wird. So wird der ansteigende Kurvenverlauf bzw. die Anstiegskurve erzeugt, die um den zeitlichen Mittelpunkt angelenkt ist, wie dies in 6 veranschaulicht ist. Der Grad der Steigung bzw. Neigung, die die variable Parametrisierung bildet, wird in Begriffen dieser Differenzwerte ausgedrückt. Eine entsprechende Lösung in umgekehrter Richtung wird für den Parameter mit fallender Neigung bzw. fallendem Kurvenverlauf angewandt.The system then enters a universal operator phase P2 in which a universal operator set OS (U) is systematically applied to all syllables. The universal operator set OS (U) contains all operators of 4 and 6 , ie OPrs, OPfs, OPsu, OPsd, which form the four pitch operators, plus ODd and ODc, which form the two duration operators. Each of these operators of the operator set OS (U) is parameterized by a corresponding value corresponding to Prs (U), Pfs (U), Psu (U), Psd (U), Dd (U) and Dc (U), respectively has been explained above (step S8). This step includes the addition of numeric values to these parameters, and is done by the operator set configuration unit 26 executed. The choice of the parameter values for the universal operator set OS (U) is made by the operator parameterization unit 8th determined as a function of the programmed emotion and the measure of the emotion plus any other factors. In the example, suppose that each of these parameters is made variable by the variable δ, whereby the respective parameters are represented as VPrs (U), VPfs (U), VPsu (U), VPsd (U), VDd (U) and VDc (U) should be designated. (Generally, in the following each parameter value or operator / operator set made variable by the variable δ is identified as such by the letter "V", which is used as the initial letter of its name.) The universal operator set VOS (U) then becomes systematic applied to all the syllables of a sentence or phrase or group of sentences (step S10). The effect includes a modifi the numerical values t1, P1-P5 of the syllable data. For the pitch operators, the pitch parameter VPrs or VPfs is translated into a set of five different values to be arithmetically applied to the values P1-P5. These difference values are chosen such that each of the values P1-P5 is shifted according to the parameterized slope, the mean value P3 remaining largely unchanged, as explained earlier. For example, the first two values of the rising slope parameters will be negative to cause the first half of the pitch to be lowered and the last two values will be positive to cause the last half of the pitch to be raised. Thus, the rising curve or the rise curve is articulated, which is articulated around the time center, as in 6 is illustrated. The degree of slope that constitutes the variable parameterization is expressed in terms of these difference values. A corresponding solution in the reverse direction is used for the parameter with falling inclination or falling curve.

Die Aufwärtsverschiebungs- oder Abwärtsverschiebungs-Operatoren können vor oder nach den Neigungs-Operatoren angewandt werden. Sie addieren oder subtrahieren einfach ein und denselben Wert, der durch die Parametrisierung bestimmt ist, zu bzw. von den fünf Tonhöhen-Werten P1–P5. Die Operatoren bilden gegenseitig sich ausschließende Paare, d. h. ein Operator für die ansteigende Neigung bzw. den ansteigenden Kurvenverlauf wird nicht angewandt, falls ein Operator für einen abfallenden Kurvenverlauf bzw. eine abfallende Neigung anzuwenden ist, und in entsprechender Weise gilt dies für die Aufwärtsverschiebungs- und Abwärtsverschiebungs- und Dauer-Operatoren.The shift up or downshift operators can before or after the slope operators. They add or just subtract one and the same value by the Parameterization is determined, to or from the five pitch values P1-P5. The Operators form mutually exclusive pairs, i. H. an operator for the rising inclination or the rising curve will not applied if an operator for to apply a sloping curve or a sloping slope and similarly applies to the upshift and downshift and persistent operators.

Die Anwendung der Operatoren (d. h. die Berechnung zur Modifizierung der Daten-Parameter t1, P1–P5) wird durch die Silbendaten-Modifizierungseinheit 48 vorgenommen.The application of the operators (ie, the calculation for modifying the data parameters t1, P1-P5) is performed by the syllable data modifying unit 48 performed.

Nachdem die Silben so durch den universellen Operatorsatz VOS(U) verarbeitet worden sind, werden sie vorläufig für eine weitere Verarbeitung, falls notwendig, gepuffert.After this the syllables are processed by the universal operator set VOS (U) they become provisional for one further processing, if necessary, buffered.

Das System tritt dann in eine wahrscheinliche Betonungsphase P2 ein, für die ein weiterer Operator-Betonungs-Parametersatz VOS(PA) erstellt wird. Dieser Operatorsatz weist dieselben Operatoren wie der universelle Operatorsatz auf, ist allerdings mit unterschiedlichen variablen Werten für die Parametrisierung versehen. Unter Heranziehung der Konvention, die für den universellen Operatorsatz angewandt ist, wird der Operatorsatz VOS(PA) durch entsprechende Werte: VPrs(PA), VPfs(PA), VPsu(PA), VPsd(PA), VDd(PA) und VDc(PA) parametrisiert. Diese Parameterwerte werden in entsprechender Weise durch die Operator-Parametrisierungseinheit 38 als Funktion der Emotion, des Emotionsgrades der Emotion und anderer Faktoren berechnet, die durch die Interfaceeinheit 40 bereitgestellt werden. Die Wahl der Parameter erfolgt generell so, dass ein Grad an Intonation (Verslehre) der Sprache entsprechend der berücksichtigten Emotion hinzugefügt wird. Ein zusätzlicher Parameter des wahrscheinlichen Betonungs-Operatorsatzes VOS(PA) ist der Wert der Wahrscheinlichkeit N, wie er oben definiert ist, der ebenfalls durch die Variable δ variabel (VN) gemacht ist. Dieser Wert hängt von der Emotion und vom Emotionsmaß sowie von anderen Faktoren, beispielsweise von der Natur der Silbendatei ab.The system then enters a probable emphasis phase P2 for which another operator stress parameter set VOS (PA) is created. This operator set has the same operators as the universal operator set, but has different variable values for parameterization. Using the convention applied to the universal operator set, the operator set VOS (PA) is replaced by corresponding values: VPrs (PA), VPfs (PA), VPsu (PA), VPsd (PA), VDd (PA), and VDc (PA) parameterized. These parameter values are correspondingly determined by the operator parameterization unit 38 calculated as a function of the emotion, the emotion level of the emotion, and other factors passing through the interface unit 40 to be provided. The choice of parameters is generally made by adding a degree of intonation (teaching) to the language according to the considered emotion. An additional parameter of the probable emphasis operator set VOS (PA) is the value of the probability N, as defined above, which is also made variable by the variable δ (VN). This value depends on the emotion and emotion measure as well as other factors, for example the nature of the syllable file.

Nachdem die Parameter erhalten worden sind, werden sie in die Operatorsatz-Konfigurationseinheit 26 eingegeben, um den vollständigen wahrscheinlichkeitstheoretischen Betonungs-Parametersatz VOS(PA) zu bilden (Schritt S12).After the parameters have been obtained, they are put into the operator set configuration unit 26 to form the complete probabilistic stress set parameter set VOS (PA) (step S12).

Anschließend wird bestimmt, welche der Silben diesem Operatorsatz VOS(PA) zu unterziehen sind, wie dies durch die Zufallseinheit 46 bestimmt wird (Schritt S14). Die letztgenannte Einheit liefert die Liste der zufällig entnommenen Silben zur Betonung durch diesen Operatorsatz. Wie oben erläutert, sind die Kandidatensilben: sämtliche Silben, falls sie mit unaussprechbaren Klängen bzw. Tönen zu tun haben oder falls keine verbotenen Betonungen bezüglich Silben vorliegen, oder lediglich die zugelassenen (betonbaren) Silben, falls diese in der Datei spezifiziert sind. Dies wird üblicherweise für sinnvolle Wörter der Fall sein.It is then determined which of the syllables are to be subjected to this set of operators VOS (PA), as by the random unit 46 is determined (step S14). The latter unit supplies the list of random syllables for emphasis by this set of operators. As discussed above, the candidate syllables are all syllables if they are dealing with unpronounceable sounds, or if there are no forbidden accents on syllables, or only the allowed syllables, if specified in the file. This will usually be the case for meaningful words.

Die aus den Kandidaten zufällig ausgewählten Silben werden dann zur Verarbeitung mittels des wahrscheinlichkeitstheoretischen Betonungs-Operatorsatzes VOS(PA) durch die Silbendaten-Modifizierungseinheit 48 (Schritt S16) abgegeben. Die tatsächliche Verarbeitung, die ausgeführt wird, ist dieselbe, wie sie oben bezüglich des universellen Operatorsatzes erläutert worden ist, und zwar mit denselben technischen Erwägungen. Der einzige Unterschied liegt in den involvierten Parameterwerten.The syllables randomly selected from the candidates are then processed by the syllable data modifier unit for processing by means of the probabilistic stressor operator set VOS (PA) 48 (Step S16). The actual processing that is performed is the same as explained above with respect to the universal operator set, with the same technical considerations. The only difference lies in the parameter values involved.

Es sei darauf hingewiesen, dass die Verarbeitung durch den wahrscheinlichkeitstheoretischen Betonungs-Operatorsatz VOS(PA) bezüglich Silbendaten vorgenommen wird, die bereits durch den universellen Operatorsatz VOS(U) verarbeitet worden sind. Mathematisch kann dieser Umstand für einen Silbendatenposten Si der Datei, die nach Heranziehen beim Schritt S14 verarbeitet worden ist, wie folgt dargestellt werden: VOS(PA).VOS(U).Si → Sipacc, wobei Sipacc die resultierenden Daten für die betonte verarbeitete Silbe darstellen.It should be noted that the processing is performed by the probabilistic emphasis operator set VOS (PA) on syllable data already represented by the universal Operational set VOS (U) have been processed. Mathematically, this circumstance may be represented for a syllable data item Si of the file which has been processed after being used in step S14, as follows: VOS (PA) .VOS (U) .Si → Sipacc, where Sipacc the resulting data for the stressed processed syllable represent.

Für sämtliche Silben bis auf die Silben der ersten und letzten Wörter eines Satzes bzw. Satzteiles, der bzw. das in der Stimmgebungs-Datendateieinheit 28 enthalten ist, liefert die Silbendaten-Modifizierungseinheit 48 die folgenden modifizierten Formen der Silbendaten (allgemein mit S bezeichnet), ursprünglich in der Datei 28:
VOS(U).S → Spna für die Silbendaten, die beim Schritt S14 nicht entnommen worden sind, wobei Spna eine verarbeitete nicht betonte Silbe bezeichnet, und
VOS(PA).VOS(U).S → Spacc für die Silbendaten, die beim Schritt S14 entnommen worden sind, wobei Spacc die verarbeitete betonte Silbe bezeichnet.
For all syllables except for the syllables of the first and last words of a sentence, the one in the vocalization data file unit 28 is contained, supplies the syllable data modifying unit 48 the following modified forms of the syllable data (indicated generally by S), originally in the file 28 :
VOS (U) .S → Spna for the syllable data not extracted at step S14, where Spna denotes a processed unstressed syllable, and
VOS (PA) .VOS (U) .S → Spacc for the syllable data taken at step S14, where Spacc designates the processed stressed syllable.

Schließlich tritt der Prozess in eine Phase P4 zur Verarbeitung einer Betonung ein, die für die ersten und letzten Silben eines Satzes bzw. Satzteiles spezifisch ist. Wenn ein Satz bzw. Satzteil aus identifizierbaren bzw. erkennbaren Wörtern besteht, wirkt diese Phase P4 dahingehend, sämtliche Silben der ersten und letzten Wörter des Satzes bzw. Satzteiles zu betonen. Der Begriff Satz bzw. Satzteil kann im normalen grammatikalischen Sinn für einen verständlichen Text verstanden werden, um gesprochen zu werden, beispielsweise hinsichtlich Pausen beim Vortrag. Im Falle eines unverständlichen Klanges, wie beim Gemurmel oder bei Tierimitationen, wird ein Satz bzw. Satzteil hinsichtlich eines Beginns und Endes der Äußerung verstanden, und zwar durch eine Pause markiert. In typischer Weise kann ein derartiger Satz bzw. Satzteil von etwa eine bis drei oder vier Sekunden dauern. Für unverständliche Klänge wird die Phase P4 zur Betonung der letzten Silben bei zumindest den ersten und letzten Silben und vorzugsweise bei den ersten m und den letzten n Silben angewandt, wobei m oder n in typischer Weise gleich etwa 2 oder 3 sind und gleich oder verschieden sein können.Finally occurs the process enters a phase P4 to process an emphasis, the for the first and last syllables of a sentence or phrase specific is. When a sentence or phrase is made identifiable or recognizable words this phase P4 acts, all syllables of the first and last words to emphasize the sentence or phrase. The term sentence or phrase can be understood in the ordinary grammatical sense Text be understood to be spoken, for example regarding breaks during the lecture. In case of incomprehensible Sound, as with mumbles or animal imitations, becomes a sentence or clause understood with respect to a beginning and end of the utterance, and marked by a break. Typically, a such sentence or phrase of about one to three or four seconds to last; to endure, to continue. For incomprehensible sounds becomes the phase P4 to emphasize the last syllable at least the first and last syllables and preferably at the first m and the last n syllables where m or n is more typical Are equal to about 2 or 3 and be the same or different can.

Wie bei den vorherigen Phasen wird eine spezifische Parametrisierung derselben Grundoperatoren VOPrs, VOPfs, VOPsu, VOPsd, VODd, VODc ausgeführt, was einen ersten und letzten Silbenbetonungs-Operatorsatz VOS(FL) ergibt, der durch einen entsprechend zugehörigen Wert parametrisiert ist, nämlich VPrs(FL), VPfs(FL), VPsu(FL), VPsd(FL), VDd(FL) und VDc(FL) (Schritt S18). Diese Parameterwerte werden durch die Operator-Parametrisierungseinheit 28 in entsprechender Weise als Funktion der Emotion, des Emotionsgrades bzw. -maßes und anderer Faktoren berechnet, die durch die Interfaceeinheit 30 bereitgestellt werden.As with the previous phases, a specific parameterization of the same primitives VOPrs, VOPfs, VOPsu, VOPsd, VODd, VODc is performed, yielding a first and last syllabic operator set VOS (FL) parameterized by a corresponding value, namely VPrs ( FL), VPfs (FL), VPsu (FL), VPsd (FL), VDd (FL) and VDc (FL) (step S18). These parameter values are determined by the operator parameterization unit 28 similarly calculated as a function of emotion, degree of emotion and other factors generated by the interface unit 30 to be provided.

Der resultierende Operatorsatz VOS(FL) wird dann bei den ersten und letzten Silben jedes Satzes bzw. Satzteiles angewandt (Schritt S20), wobei diese Silben durch die Silben-Detektoreinheit 34 für die ersten/letzten Silben identifiziert werden.The resulting operator set VOS (FL) is then applied to the first and last syllables of each sentence (step S20), these syllables being represented by the syllable detector unit 34 be identified for the first / last syllables.

Wie oben erläutert, werden die Silbendaten, auf die der Operatorsatz VOS(FL) angewandt ist, zuvor durch den universellen Operatorsatz VOS(U) beim Schritt S10 verarbeitet worden sein. Zusätzlich kann es vorkommen, dass eine erste oder letzte Silbe bzw. erste oder letzte Silben beim Zufalls-Auswahlschritt S14 ebenfalls entnommen worden sind und dadurch ebenfalls mittels des wahrscheinlichkeitstheoretischen Betonungs-Operatorsatzes VOS(PA) verarbeitet werden.As explained above become the syllable data to which the operator set VOS (FL) applies is, previously through the universal operator set VOS (U) at the step S10 has been processed. additionally It may happen that a first or last syllable or first or last syllables at the random selection step S14 also taken and thus also by means of the probabilistic theory Emphasis operator set VOS (PA).

Es gibt somit zwei Möglichkeiten der Verarbeitung bezüglich einer ersten oder letzten Silbe, und zwar nachstehend ausgedrückt unter Heranziehung der oben festgelegten Konvention:
Möglichkeit 1: Verarbeitung durch den Operatorsatz VOS(U) und sodann durch den Operatorsatz VOS(FL), was zu VOS(FL).VOS(U).S → Spfl(1) führt, und
Möglichkeit 2: aufeinander folgende Verarbeitung durch die Operatorsätze VOS(U), VOS(PA) und VOS(FL), was zu VOS(FL).VOS(PA).VOS(U).S → Spfl(2) führt.
Thus, there are two ways of processing for a first or last syllable, expressed below, using the convention set forth above:
Possibility 1: Processing by the operator set VOS (U) and then by the operator set VOS (FL), resulting in VOS (FL) .VOS (U) .S → Spfl (1), and
Possibility 2: successive processing by the operator sets VOS (U), VOS (PA) and VOS (FL), resulting in VOS (FL) .VOS (PA) .VOS (U) .S → Spfl (2).

Diese einfache Operator-basierte Lösung hat sich als Lösung erwiesen, die zu Ergebnissen führt, welche zumindest vergleichbar sind mit jenen, die durch wesentlich kompliziertere Systeme erreicht werden, und zwar sowohl hinsichtlich bedeutungsvoller Äußerungen als auch in der Aussprache einer erkennbaren Sprache.These simple operator-based solution has come up as a solution proven that leads to results, which are at least comparable to those that are essential more complicated systems are achieved, both in terms of meaningful statements as well as in the pronunciation of a recognizable language.

Die Wahl der Parametrisierungen zum Ausdruck einer bestimmten Emotion ist extrem subjektiv und variiert beträchtlich in Abhängigkeit von der Form der Äußerung, der Sprache, etc. Aufgrund der Verfügung von einfachen, gut definierten Parametern, die nicht viel Echtzeitverarbeitung erfordern, ist es jedoch einfach, eine Abtastung durch viele mögliche Kombinationen von Parametrisierungen vorzunehmen, um die zufriedenstellendsten Operatorsätze zu erhalten.The choice of parametrizations to express a particular emotion is extremely subjective and varies considerably depending on the form of the utterance, the language, etc. However, because of the availability of simple, well-defined parameters that do not require much real-time processing, it is easy Scanning through many possible combinations of parametrizations to make the most satisfactory lendsten operator sets.

Für jede Parametrisierung, der eine bestimmte Emotion zugehörig ist, kann ein Bereich von Variabilität in den Parameterwerten gemäß der Erfindung festgelegt werden, was eine Steuerung des Maßes der betreffenden erzeugten Emotion ermöglicht.For every parameterization, that belongs to a certain emotion may be a range of variability in the parameter values according to the invention which control of the amount of the respective generated generated Emotion allows.

Der Anmelder hat, um lediglich ein veranschaulichendes Beispiel anzugeben, herausgefunden, dass gute Ergebnisse mit folgenden Parametrisierungen erzielt werden können:
Traurigkeit: die Tonhöhe für den universellen Operatorsatz = abfallender Kurvenverlauf mit geringer Neigung,
Dauer-Operator = Dehnung,
Wahrscheinlichkeit der Entnahme von N für eine Betonung: gering;
Ruhe: kein Operatorsatz wird angewandt oder lediglich ein leicht parametrisierter universeller Operator;
Fröhlichkeit: Tonhöhe für universellen Operatorsatz = ansteigender Kurvenverlauf, moderat hohe Steigung,
Dauer für universellen Operatorsatz = Schrumpfung,
Dauer für betonten Operatorsatz = Dehnung;
Ärger: Tonhöhe für sämtliche Operatorsätze = abfallender Kurvenverlauf, moderat hohe Neigung,
Dauer für sämtliche Operatorsätze = Schrumpfung.
Applicant has found, for purposes of exemplification only, that good results can be achieved with the following parameterizations:
Sadness: the pitch for the universal operator set = sloping curve with low slope,
Duration operator = stretch,
Probability of taking N for an emphasis: low;
Rest: no operator set is applied or just a slightly parameterized universal operator;
Happiness: Pitch for universal operator set = rising curve, moderately high gradient,
Duration for universal operator set = shrinkage,
Duration for stressed operator set = stretch;
Annoyance: pitch for all operator sets = declining curve, moderately high slope,
Duration for all operator sets = shrinkage.

Für einen Operatorsatz, der beim obigen Beispiel nicht spezifiziert worden ist, ist die Parametrisierung vom selben allgemeinen Typ für sämtliche Operatorsätze. Allgemein gesagt ist der Typ bzw. die Art von Änderungen (ansteigender Kurvenverlauf, Schrumpfung, etc.) die- bzw. derselbe für sämtliche Operatorsätze; lediglich die tatsächlichen Werte sind unterschiedlich. Hier werden die Werte üblicherweise so gewählt, dass der geringste Änderungsbetrag durch den universellen Operatorsatz hervorgerufen wird und dass der größte Änderungsbetrag durch die erste und letzte Silbenbetonung hervorgerufen wird, wobei der wahrscheinlichkeitstheoretische Betonungs-Operatorsatz einen mittleren Änderungsbetrag hervorruft.For one Operator set not specified in the above example is, the parameterization is of the same general type for all Operator sets. Generally speaking, the type or type of changes (increasing curve, Shrinkage, etc.) the same for all operator sets; only the actual Values are different. Here are the values usually chosen so that the least amount of change is caused by the universal operator set and that the largest amount of change is caused by the first and last syllabic emphasis, where the probabilistic emphasis operator set one mean amount of change causes.

Das System kann außerdem so gestaltet sein, dass es Intensitäts-Operatoren OI in seinem Satz verwendet, und zwar in Abhängigkeit von der benutzten Parametrisierung.The System can also be designed so that there are intensity operators OI in his Sentence used, depending on from the used parameterization.

Die Interfaceeinheit 40 kann in ein Computer-Interface integriert sein, um verschiedene Steuerungen bereitzustellen. Unter diesen Steuerungen kann eine Direktwahl von Parametern der oben erwähnten verschiedenen Operatorsätze sein, um dem Benutzer U zu ermöglichen, eine Feinabstimmung des Systems vorzunehmen. Das Interface kann dadurch benutzerfreundlich gemacht sein, dass Sichtskalen bereitgestellt werden, die beispielsweise grafisch die Steigungs- bzw. Neigungswerte, die Verschiebewerte, die Schrumpfungs-/Dehnungswerte für die verschiedenen Parameter veranschaulichen.The interface unit 40 can be integrated into a computer interface to provide various controls. Among these controls may be a direct selection of parameters of the above-mentioned various operator sets to allow user U to fine-tune the system. The interface may be made user-friendly by providing visual scales that graphically illustrate, for example, the slope values, the displacement values, the shrinkage / strain values for the various parameters.

Die Erfindung kann viele weitere Arten von Emotion-Synthesesystemen umfassen. Während sie besonders geeignet ist fair Synthesesysteme, die eine Emotion in Sprache oder Schall ausdrücken, kann die Erfindung auch für andere Arten von Emotions-Synthesesystemen in Betracht gezogen werden, bei denen die Emotion in anderen Formen dargestellt wird: Gesichts- oder Körperausdrücke, visuelle Effekte, etc., die Bewegung von animierten Objekten, bei denen die involvierten Parameter einen Typ bzw. eine Art der darzustellenden Emotion reflektieren.The Invention can be many more types of emotion synthesis systems include. While She is particularly suited to fair synthesis systems that have an emotion express in speech or sound, the invention can also for other types of emotion synthesis systems to be considered in which the emotion is in other forms is displayed: facial or body expressions, visual effects, etc., the movement of animated objects involving those involved Parameters reflect a type or type of emotion to be represented.

Claims (20)

Verfahren zur Steuerung des Betriebs eines Geräts (2; 12) zum Synthetisieren einer in einen Klang übertragenen Emotion, wobei das Gerät zumindest einen Eingang für einen Parameter (Pi) aufweist, dessen Wert (Ei) verwendet wird, um einen zu übertragenden Emotionstyp festzulegen bzw. einzustellen, umfassend die Verfahrensschritte: – Programmieren des Eingangssignals/der Eingangssignale mit einer Parametrisierung, um einen bestimmten Emotionstyp (E) zu erzeugen, und – Verleihen einer Variabilität in einem Maß an den betreffenden zu übertragenden Emotionstyp; dadurch gekennzeichnet, dass die Variabilität in dem Maß an den genannten Emotionstyp erhalten wird, indem innerhalb eines vorherbestimmten Steuerungsbereiches zumindest ein Parameter (Pi), welcher verwendet wird, um einen Emotionstyp festzulegen bzw. einzustellen, einer Abweichung bzw. Auslenkung von seinem Anfangsstandardwert (Ei) unterzogen wird.Method for controlling the operation of a device ( 2 ; 12 ) for synthesizing an emotion transmitted to a sound, the apparatus having at least one input for a parameter (Pi) whose value (Ei) is used to set an emotion type to be transmitted, comprising the steps of: - programming the input signal / the input signals with a parameterization to generate a certain type of emotion (E), and - imparting variability in an amount to the respective type of emotion to be transmitted; characterized in that the variability is obtained to the degree of said emotion type by, within a predetermined control range, determining at least one parameter (Pi) used to set an emotion type, a deviation from its initial default value (Ei ). Verfahren nach Anspruch 1, wobei der zumindest eine variable Parameter (VPi) entsprechend einem lokalen Modell über den Steuerungsbereich variabel gemacht wird, wobei das Modell ein Maß bzw. eine Größe einer Emotionssteuerungsvariablen (6) auf den variablen Parameter (VPi) bezieht und wobei das Maß bzw. die Größe der Emotionssteuerungsvariablen verwendet wird, um einen Wert des variablen Parameters variabel einzurichten.The method of claim 1, wherein the at least one variable parameter (VPi) is made variable according to a local model over the control region, wherein the model is a measure of an emotion control variable (VP). 6 ) refers to the variable parameter (VPi) and wherein the measure or the Size of the emotion control variable is used to variably set a value of the variable parameter. Verfahren nach Anspruch 2, wobei das lokale Modell ein lokales lineares Modell für den Steuerungsbereich und für einen gegebenen Emotionstyp ist, wobei der variable Parameter (VPi) so festgelegt ist, dass er sich linear über den Steuerungsbereich mittels des Maßes der Emotionssteuerungsvariablen (6) ändert.The method of claim 2, wherein the local model is a local linear model for the control domain and for a given emotion type, the variable parameter (VPi) being determined to be linear over the control domain by means of the measure of the emotion control variable (VPi). 6 ) changes. Verfahren nach einem der Ansprüche 1 bis 3, wobei das Maß der Emotion durch eine Steuerungsvariable (δ) bestimmt wird, welche den variablen Parameter (VPi) entsprechend einer Beziehung modifiziert, die durch folgende Formel gegeben ist: VPi = A + δB,in der VPi der Wert des fraglichen variablen Parameters ist, A und B für den Steuerungsbereich zugelassene Werte sind und δ das Maß der Emotionssteuerungsvariablen ist.Method according to one of claims 1 to 3, wherein the measure of the emotion is determined by a control variable (δ) which modifies the variable parameter (VPi) according to a relationship given by the formula: VPi = A + δB, in VPi is the value of the variable parameter in question, A and B are values allowed for the control region, and δ is the measure of the emotion control variable. Verfahren nach Anspruch 4, wobei A ein Wert innerhalb des Steuerungsbereiches ist, wobei das Maß der Emotionssteuerungsvariablen (δ) in einem Intervall variabel ist, welches den Wert Null enthält.The method of claim 4, wherein A is a value within of the control region, where is the measure of the emotion control variables (δ) in one Interval is variable, which contains the value zero. Verfahren nach Anspruch 5, wobei A im Wesentlichen der Mittelwert (Emr) des Steuerungsbereiches ist und wobei das Maß der Emotionssteuerungsvariablen (δ) in einem Intervall variabel ist, dessen Mittelwert Null ist.The method of claim 5, wherein A is substantially the mean value (Emr) of the control region is and where is the measure of the emotion control variable (δ) in one Interval is variable whose mean is zero. Verfahren nach Anspruch 6, wobei das Maß der Emotionssteuerungsvariablen (δ) in einem Intervall von –1 bis +1 variabel ist.The method of claim 6, wherein the measure of the emotion control variables (δ) in one Interval of -1 until +1 is variable. Verfahren nach einem der Ansprüche 4 bis 7, wobei B bestimmt wird durch B = (Eimax – A) oder durch B = (Eimin + A), wobei Eimax der Wert des Eingangsparameters ist, um das maximale Maß des zu übertragenden Emotionstyps in dem Steuerungsbereich zu erzeugen, und wobei Eimin der Wert des Parameters ist, um das minimale Maß des zu übertragenden Emotionstyps in dem Steuerungsbereich zu erzeugen.A method according to any one of claims 4 to 7, wherein B is determined is going through B = (Eimax - A) or by B = (Eimin + A), where Eimax is the value of the input parameter is to the maximum degree of to be transferred To create emotion type in the control area and where Eimin the value of the parameter is to calculate the minimum dimension of the Create emotion type in the control area. Verfahren nach einem der Ansprüche 4 bis 8, wobei A gleich dem Standardparameterwert (Ei) ist, welcher ursprünglich spezifiziert wurde, um einen zu übertragenden Emotionstyp festzulegen bzw. einzustellen.Method according to one of claims 4 to 8, wherein A is the same is the default parameter value (Ei), which is originally specified became one to transfer Define or set emotion type. Verfahren nach Anspruch 8 oder 9, wobei der Wert Eimax oder Eimin durch Abweichen von dem Standardparameterwert (Ei), welcher ursprünglich spezifiziert wurde, um einen zu übertragenden Emotionstyp festzulegen bzw. einzustellen, und durch Bestimmen einer Maximalabweichung in Zunahme- oder Abnahmerichtung, was eine gewünschte Grenze für das Maß der durch den Steuerungsbereich zu übertragenden Emotion ergibt, experimentell bestimmt wird.Method according to claim 8 or 9, wherein the value Eimax or Eimin by deviating from the default parameter value (Ei), which originally was specified to be transmitted Determine or set emotion type, and by determining a Maximum deviation in increase or decrease direction, which is a desired limit for the Measure of through the control area Emotion results, is determined experimentally. Verfahren nach einem der Ansprüche 1 bis 10, wobei dasselbe Maß der Emotionssteuerungsvariablen (δ) verwendet wird, um eine Vielzahl von variablen Parametern (VP1–VPN) des Emotionssynthetisiergerätes (2; 12) gemeinsam festzulegen.Method according to one of claims 1 to 10, wherein the same measure of the emotion control variable (δ) is used to generate a plurality of variable parameters (VP1-VPN) of the emotion synthesizer ( 2 ; 12 ) together. Vorrichtung (10) zur Steuerung des Betriebs eines Systems (2; 12) zum Synthetisieren einer in einen Klang übertragenen Emotion, wobei das System zumindest einen Eingang für einen Parameter (Pi) aufweist, dessen Wert (Ei) verwendet wird, um einen zu übertragenden Emotionstyp festzulegen bzw. einzustellen, dadurch gekennzeichnet, dass die Vorrichtung umfasst: – Mittel zum Programmieren des Eingangssignals/der Eingangssignale mit einer Parametrisierung, um einen bestimmten Emotionstyp (E) zu erzeugen, und – Variationsmittel (14, 16, 18) zum Verleihen einer Variabilität in dem Maß des zu übertragenden Emotionstyps und dadurch gekennzeichnet, dass die Variationsmittel (14, 16, 18) in der Lage sind, innerhalb eines vorbestimmten Steuerungsbereiches zumindest einen Parameter (Pi), welcher verwendet wird, um einen Emotionstyp festzulegen, einer Abweichung von seinem Anfangsstandardwert (Ei) zu unterziehen.Contraption ( 10 ) for controlling the operation of a system ( 2 ; 12 ) for synthesizing an emotion transmitted in a sound, the system having at least one input for a parameter (Pi) whose value (Ei) is used to set an emotion type to be transmitted, characterized in that the device comprises: - means for programming the input signal (s) with a parameterization to generate a particular type of emotion (E), and - variation means ( 14 . 16 . 18 ) for imparting variability to the extent of the type of emotion to be transmitted and characterized in that the variation means ( 14 . 16 . 18 ) are capable, within a predetermined control range, of at least one parameter (Pi) used to determine an emotion type submit to a deviation from its initial default value (Ei). Vorrichtung nach Anspruch 12, wobei auf die Variationsmittel (14, 16, 20) zugreifbar ist, um zu bewirken, dass zumindest ein variabler Parameter (VPi) sich auf ein Maß der Emotionssteuerungsvariablen (δ) hin ändert, auf das zugreifbar ist, um einen Wert des variablen Parameters variabel festzulegen.Device according to claim 12, wherein the variation means ( 14 . 16 . 20 ) is operable to cause at least one variable parameter (VPi) to change to a measure of the emotion control variable (δ) that is accessible to variably set a value of the variable parameter. Vorrichtung nach Anspruch 13, wobei die Variationsmittel (14, 16, 18) bewirken, dass sich der variable Parameter (VPi) entsprechend einem lokalen linearen Modell mit einer Variation in dem Maß der Emotionssteuerungsvariablen (6) linear verändert.Apparatus according to claim 13, wherein the variation means ( 14 . 16 . 18 ) cause the variable parameter (VPi) to correspond to a local linear model with a variation in the extent of the emotion control variable (VPi) 6 ) changed linearly. Vorrichtung nach Anspruch 13 oder 14, wobei das Maß der Emotionssteuerungsvariablen (δ) in einem Intervall variabel ist, welches den Wert Null enthält.Apparatus according to claim 13 or 14, wherein the Measure of Emotion control variables (δ) is variable in an interval containing the value zero. Vorrichtung nach Anspruch 15, wobei das Maß der Emotionssteuerungsvariablen (δ) in einem Intervall von –1 bis +1 variabel ist.The apparatus of claim 15, wherein the measure of emotion control variables (δ) in one Interval of -1 until +1 is variable. Vorrichtung nach einem der Ansprüche 12 bis 16, wobei die Variationsmittel (14, 16, 20) bewirken, dass sich zumindest ein variabler Parameter (VPi) auf ein Maß der Emotionssteuerungsvariablen (5) hin entsprechend einer der folgenden Formeln verändert: VPi = Emr + δ(Eimax – Emr)oder VPi = Emr + δ(Eimin + Emr)wobei δ der Wert des Maßes der Emotionssteuerungsvariablen ist, Emr im Wesentlichen der Mittelwert des Steuerungsbereiches und vorzugsweise gleich der Standardparameterwert (Ei) ist, welcher ursprünglich spezifiziert wurde, um einen zu übertragenden Emotionstyp festzulegen, Eimax der Wert des Parameters zum Erzeugen des maximalen Maßes des zu übertragenden Emotionstyps in dem Steuerungsbereich ist und Eimin der Wert des Parameters zum Erzeugen des minimalen Maßes des zu übertragenden Emotionstyps in dem Steuerungsbereich ist.Device according to one of claims 12 to 16, wherein the variation means ( 14 . 16 . 20 ) cause at least one variable parameter (VPi) to relate to a measure of the emotion control variables ( 5 ) according to one of the following formulas: VPi = Emr + δ (Eimax - Emr) or VPi = Emr + δ (Eimin + Emr) where δ is the value of the measure of the emotion control variable, Emr is essentially the average of the control region and preferably equal to the default parameter value (Ei) originally specified to specify an emotion type to be transmitted, Eimax the value of the parameter for generating the maximum measure of Eimin is the value of the parameter for generating the minimum amount of emotion type to be transmitted in the control area. Vorrichtung nach einem der Ansprüche 12 bis 17, welche betreibbar ist, um mit dem gleichen Maß der Emotionssteuerungsvariablen (δ) eine Vielzahl von variablen Parameter (VP1–VPN) des Emotionssynthetisiersystems (2; 12) gemeinsam festzulegen, um einen Wert des variablen Parameters variabel festzulegen.Apparatus according to any one of claims 12 to 17, operable to apply, with the same degree of emotion control variable (δ), a plurality of variable parameters (VP1-VPN) of the emotion-synthesizing system (16). 2 ; 12 ) to variably set a value of the variable parameter. System, umfassend ein Emotionssynthetisiergerät (2; 12) mit zumindest einem Eingang für die Aufnahme zumindest eines Parameters (Pi), dessen Wert (Ei) verwendet wird, um einen zu übertragenden Emotionstyp festzulegen, und eine Vorrichtung (10) nach einem der Ansprüche 13 bis 19, welche sich im Wirkverbund befindet, um eine Variable (VPi) an den zumindest einen Eingang zu liefern, um dadurch eine Variabilität in dem Maß eines zu übertragenden Emotionstyps zu erteilen.System comprising an emotion synthesizer ( 2 ; 12 ) having at least one input for receiving at least one parameter (Pi) whose value (Ei) is used to determine an emotion type to be transmitted, and a device ( 10 ) according to any one of claims 13 to 19, which is operatively connected to provide a variable (VPi) to the at least one input thereby to impart variability in the degree of emotion type to be transmitted. Computerprogramm, welches von einem Computer ausführbare Befehle bereitstellt, deren Ablauf in einem Datenprozessor bewirken, dass der Datenprozessor sämtliche Schritte des Verfahrens nach einem der Ansprüche 1 bis 11 ausführt.Computer program which executes computer-executable instructions whose execution in a data processor causes the data processor all Steps of the method according to one of claims 1 to 11 executes.
DE2001631521 2001-05-11 2001-08-14 Method and device for controlling the operation of a device or a system, and system having such a device and computer program for carrying out the method Expired - Lifetime DE60131521T2 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP01401203A EP1256931A1 (en) 2001-05-11 2001-05-11 Method and apparatus for voice synthesis and robot apparatus
EP01401203 2001-05-11
EP20010401880 EP1256932B1 (en) 2001-05-11 2001-07-13 Method and apparatus for synthesising an emotion conveyed on a sound
EP01401880 2001-07-13

Publications (2)

Publication Number Publication Date
DE60131521D1 DE60131521D1 (en) 2008-01-03
DE60131521T2 true DE60131521T2 (en) 2008-10-23

Family

ID=26077240

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2001631521 Expired - Lifetime DE60131521T2 (en) 2001-05-11 2001-08-14 Method and device for controlling the operation of a device or a system, and system having such a device and computer program for carrying out the method

Country Status (2)

Country Link
EP (1) EP1256932B1 (en)
DE (1) DE60131521T2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007010680A1 (en) 2005-07-20 2007-01-25 Matsushita Electric Industrial Co., Ltd. Voice tone variation portion locating device
CN101901598A (en) * 2010-06-30 2010-12-01 北京捷通华声语音技术有限公司 Humming synthesis method and system
CN111816158B (en) * 2019-09-17 2023-08-04 北京京东尚科信息技术有限公司 Speech synthesis method and device and storage medium
CN113611326B (en) * 2021-08-26 2023-05-12 中国地质大学(武汉) Real-time voice emotion recognition method and device
CN120336509B (en) * 2025-06-11 2025-09-19 江西财经大学 Speaker Relationship-Based Multimodal Dialogue Sentiment-Reason Pair Extraction Method

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5860064A (en) * 1993-05-13 1999-01-12 Apple Computer, Inc. Method and apparatus for automatic generation of vocal emotion in a synthetic text-to-speech system
US6185534B1 (en) * 1998-03-23 2001-02-06 Microsoft Corporation Modeling emotion and personality in a computer user interface
JP2001154681A (en) * 1999-11-30 2001-06-08 Sony Corp Audio processing device, audio processing method, and recording medium

Also Published As

Publication number Publication date
EP1256932A2 (en) 2002-11-13
EP1256932A3 (en) 2004-10-13
DE60131521D1 (en) 2008-01-03
EP1256932B1 (en) 2006-05-10

Similar Documents

Publication Publication Date Title
DE69917415T2 (en) Speech synthesis with prosody patterns
DE60112512T2 (en) Coding of expression in speech synthesis
DE69031165T2 (en) SYSTEM AND METHOD FOR TEXT-LANGUAGE IMPLEMENTATION WITH THE CONTEXT-DEPENDENT VOCALALLOPHONE
DE602004000873T2 (en) Apparatus for synthesizing a singing voice, taking into account different models depending on the approach context of the sung notes
DE69719654T2 (en) Prosody databases for speech synthesis containing fundamental frequency patterns
DE60119496T2 (en) Method and device for synthesizing an emotion transmitted by means of a sound
DE2945413C1 (en) Method and device for synthesizing speech
DE69719270T2 (en) Speech synthesis using auxiliary information
DE60020434T2 (en) Generation and synthesis of prosody patterns
DE60035001T2 (en) Speech synthesis with prosody patterns
DE69629486T2 (en) CONTROL STRUCTURE FOR SOUND SYNTHESIS
DE69028072T2 (en) Method and device for speech synthesis
DE69617581T2 (en) System and method for determining the course of the fundamental frequency
DE60126564T2 (en) Method and arrangement for speech synthesis
DE60118874T2 (en) Prosody pattern comparison for text-to-speech systems
DE69620399T2 (en) VOICE SYNTHESIS
DE60110315T2 (en) Train acoustic models for resistance to noise
DE60004420T2 (en) Recognition of areas of overlapping elements for a concatenative speech synthesis system
DE2115258A1 (en) Speech synthesis by concatenating words encoded in formant form
EP1105867B1 (en) Method and device for the concatenation of audiosegments, taking into account coarticulation
DE69917960T2 (en) Phoneme-based speech synthesis
DE60307965T2 (en) Apparatus and method for changing the playback speed of stored speech signals
DE69318209T2 (en) Method and arrangement for speech synthesis
DE60205421T2 (en) Method and apparatus for speech synthesis
DE69009571T2 (en) Speech synthesizer.

Legal Events

Date Code Title Description
8364 No opposition during term of opposition