[go: up one dir, main page]

JPH0744727A - 画像作成方法およびその装置 - Google Patents

画像作成方法およびその装置

Info

Publication number
JPH0744727A
JPH0744727A JP5184260A JP18426093A JPH0744727A JP H0744727 A JPH0744727 A JP H0744727A JP 5184260 A JP5184260 A JP 5184260A JP 18426093 A JP18426093 A JP 18426093A JP H0744727 A JPH0744727 A JP H0744727A
Authority
JP
Japan
Prior art keywords
mouth shape
parameter
image
voice
mouth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5184260A
Other languages
English (en)
Inventor
Makoto Akaha
誠 赤羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP5184260A priority Critical patent/JPH0744727A/ja
Publication of JPH0744727A publication Critical patent/JPH0744727A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】 【目的】 入力音声に同期して口形状の変化するアニメ
ーションを、容易に得ることができるようにする。 【構成】 音声から抽出した音響パラメータを、画像の
口形状を変化させるための加重パラメータに変換する変
換関数を、重回帰分析によってあらかじめ求めておく。
そして、音響分析部1において、入力された音声から、
音響パラメータが抽出され、加重パラメータ変換部2に
おいて、その音響パラメータが、あらかじめ求められた
変換関数によって、加重パラメータに変換される。そし
て、その加重パラメータに基づいて、口形状の変化する
アニメーションが、顔画像合成器3により生成される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力された音声に同期
して、例えば口形状を変化させるアニメーションを作成
する場合などに用いて好適な画像作成方法およびその装
置に関する。
【0002】
【従来の技術】従来、音声にあわせて口や顎などが動く
アニメーションは、そのように口や顎が動いているよう
に見えるように、段階的に口や顎の形が変化する複数の
セル画を用いて作成される。
【0003】
【発明が解決しようとする課題】従って、音声にあわせ
て口や顎などが動くアニメーションを作成するには、多
くのセル画を描かなければならず、非常に多くの労力が
必要であった。
【0004】そこで、音声から、音響パラメータを抽出
し、その音響パラメータに対応して、アニメーションの
口や顎が動くように、アニメーションのパラメータを変
化させる方法が考えられる。
【0005】しかしながら、従来においては、音響パラ
メータから、アニメーションのパラメータを算出する場
合、動きに違和感のないアニメーションを得ようとする
と、音響パラメータに対し非線形演算処理を行う必要が
あり、従ってその負荷に耐えることのできる装置を実現
しようとすると、装置が大型化、高コスト化する課題が
あった。
【0006】本発明は、このような状況に鑑みてなされ
たものであり、音声に同期して、表情が豊かに変化する
画像を、容易に得ることができるようにするものであ
る。
【0007】
【課題を解決するための手段】本発明の画像作成方法
は、入力された音声に同期した画像を作成する画像作成
方法において、音声から抽出した音響パラメータを、画
像の口形状を変化させるための加重パラメータに変換す
る変換関数を、重回帰分析によってあらかじめ求めてお
き、変換関数によって、音響パラメータを加重パラメー
タに変換し、加重パラメータに基づいて、あらかじめ設
定された基本口形状を変化させ、画像を作成することを
特徴とする。
【0008】この画像作成方法は、基本口形状が、
「あ」、「い」、および「う」を発音する口形状、並び
に口を閉じた形の口形状でなるようにすることができ
る。
【0009】本発明の画像作成装置は、入力された音声
に同期した画像を作成する画像作成装置において、音声
を音響分析し、音響パラメータを算出する分析手段とし
ての音響分析部1と、重回帰分析によってあらかじめ求
められた、音響パラメータを、画像の口形状を変化させ
るための加重パラメータに変換する変換関数によって、
音響パラメータを加重パラメータに変換する変換手段と
しての加重パラメータ変換部2と、加重パラメータに基
づいて、あらかじめ設定された基本口形状を変化させ、
画像を作成する作成手段としての顔画像合成器3とを備
えることを特徴とする。
【0010】この画像作成装置は、基本口形状が、
「あ」、「い」、および「う」を発音する口形状、並び
に口を閉じた形の口形状でなるようにすることができ
る。
【0011】
【作用】本発明の画像作成方法および画像作成装置にお
いては、音声を音響分析し、音響パラメータを算出し
て、重回帰分析によってあらかじめ求められた、音響パ
ラメータを、画像の口形状を変化させるための加重パラ
メータに変換する変換関数によって、加重パラメータに
変換する。そして、加重パラメータに基づいて、あらか
じめ設定された基本口形状を変化させ、画像を作成す
る。従って、音声に同期して口形状の変化する画像を、
少ない演算量によって得ることができる。
【0012】
【実施例】図1は、本発明を適用した音声顔画像同期装
置の一実施例の構成を示すブロック図である。発声され
た音声は、音声分析部1に入力される。音声分析部1
は、入力された音声から、音声の音響パラメータとして
の、例えばLPCケプストラム係数を抽出し、加重パラ
メータ変換部2に出力する。加重パラメータ変換部2
は、音声分析部1からのLPCケプストラムを、入力さ
れた音声に対応して、口形状の変化するアニメーション
を生成するための加重パラメータに変換し、顔画像合成
器3に出力する。顔画像合成器3は、加重パラメータ変
換部2からの加重パラメータに基づいて、口形状の変化
するアニメーションを生成し、例えば図示せぬディスプ
レイに表示する。
【0013】なお、本明細書中において、口形状とは、
特に断らない限り、口の他、声を発するために動く、例
えば下顎などの顔の部分すべてを意味する。
【0014】次に、その動作について説明する。音響分
析部1は、例えば図2に示すような、入力された音声を
サンプリングして、例えば線形予測分析処理などの音響
分析処理を施し、音声のスペクトル包絡特性を表す線形
予測係数を算出する。なお、本実施例においては、入力
された音声を、例えば8kHzでサンプリングし、24
0サンプル(=30ms)分の幅を有するハミング窓
を、120サンプル(=15ms)ずつシフトしながら
かけ、いわゆる自己相関法によって、10次までの線形
予測係数を算出するものとする。
【0015】そして、音響分析部1は、以上のようにし
て算出した線形予測係数から、広く知られた再帰式(例
えば、「ディジタル音声処理」、古井著、東海大学出版
会発行、47ページに記載されている再帰式)にしたが
って、線形予測係数と同次数までのLPCケプストラム
係数を算出し、加重パラメータ変換部2に出力する。従
って、本実施例では、15msごとに10次までのLP
Cケプストラム係数が、加重パラメータ変換部2に出力
されることになる。
【0016】ここで、LPCケプストラムは、少ない次
数で、音声のスペクトル包絡特性を、精度良く表すこと
が知られている。
【0017】加重パラメータ変換部2は、重回帰分析に
よってあらかじめ求めた、後述する変換関数(重回帰
式)によって、音響分析部1から時系列に出力されるL
PCケプストラム係数を、例えば図3に示すような、ア
ニメーションの口形状を表現するための、例えば4つの
基本パターン(以下、口形状オブジェクトという)それ
ぞれの、いわば重みとしての加重パラメータW1乃至W4
に変換し、顔画像合成器3に順次出力する。
【0018】顔画像合成器3は、加重パラメータ変換部
2より出力される加重パラメータW1乃至W4と、あらか
じめ設定された基本口形状との間に、例えば多重内挿法
を適用することにより、音響分析部1に入力された音声
に同期して口の形状(口形状)の変化するアニメーショ
ンを生成する。
【0019】即ち、顔画像合成器3には、図3に示す、
アニメーションの口形状の基本パターンとしての4つの
口形状オブジェクトが記憶されており、各口形状オブジ
ェクトを、加重パラメータ変換部2からの加重パラメー
タW1乃至W4に基づいて混合(多重内挿)し、音響分析
部1に入力された音声に対応した口形状のアニメーショ
ンを生成する。
【0020】ここで、図3(A)の口形状オブジェクト
は、下顎をおろして口を開いた「あ」の音声を発声する
口形状を示し、図3(B)の口形状オブジェクトは、歯
を剥いて唇を横に開いた「い」の音声を発声する口形状
を示している。また、図3(C)の口形状オブジェクト
は、唇をつぼめた「う」の音声を発声する口形状を示
し、図3(D)の口形状オブジェクトは、自然に口を閉
じたときの口形状を示している。
【0021】例えば「え」の音声を発声する口形状は、
「あ」の音声を発声する口形状(図3(A))と、
「い」の音声を発声する口形状(図3(B))との中間
の口形状で表現することができ、また「お」の音声を発
声する口形状は、「あ」の音声を発声する口形状(図3
(A))と、「う」の音声を発声する口形状(図3
(C))との中間の口形状で表現することができる。
【0022】さらに、子音を発声する口形状など、上述
の「あ」、「い」、「う」、「え」、および「お」の5
母音以外の口形状も、図3に示す口形状オブジェクト
を、所定の割合(重み)で混合することにより表現する
ことができる。
【0023】従って、顔画像合成器3においては、図5
に示すように、加重パラメータ変換部2から時系列に出
力される加重パラメータW1乃至W4それぞれに基づい
て、「あ」、「い」、「う」、口を閉じた形を表現する
口形状オブジェクトN1乃至N4を混合(多重内挿)(図
中、加算演算し(+)で示す)する割合を変えることに
より、音響分析部1に入力された音声に対応して、口形
状Aの変化するアニメーションが生成される。
【0024】ここで、図2に示す波形の音声に対する、
「あ」、「い」、または「う」それぞれの口形状オブジ
ェクトN1乃至N3の加重パラメータW1乃至W3の変化を
図4に示す。加重パラメータは、0乃至1の範囲の値を
とり、それが1.0の場合、その加重パラメータに対す
る口形状オブジェクトは、そのまま他の口形状オブジェ
クトと混合される。そして、加重パラメータが1.0よ
り小さい値になるにしたがって、その加重パラメータに
対する口形状オブジェクトは、元の形状をほぼ相似に小
さくした形状にされ、他の口形状オブジェクトと混合さ
れる。
【0025】また、加重パラメータが0の場合、その加
重パラメータに対する口形状オブジェクトは、他の口形
状オブジェクトと混合されない。従って、この場合、加
重パラメータが0である口形状オブジェクトは用いられ
ずに、アニメーションの口形状が生成されることにな
る。
【0026】次に、音響分析部1から時系列に出力され
るLPCケプストラム係数を、加重パラメータに変換す
る変換関数(重回帰式)を、重回帰分析によって求める
方法について説明するが、その準備として重回帰分析に
ついて簡単に説明する。
【0027】なお、重回帰分析の詳細については、例え
ば「多変量解析のはなし」、有馬、石村著、東京図書発
行や、「多変量解析法」、奥野 他著、日科技連発行な
どに記載されている。
【0028】重回帰分析法は、多変量解析法の1種で、
目的変量yと呼ばれる結果と、それに影響を与える、説
明変量xq(q=1,2,・・・,Q)と呼ばれる原因
を用いて、最も誤差の少ない、目的変量yの予測値Yを
与える式(重回帰式) Y=a0+a11+a22+・・・+aQQ (1) を求め、これにより目的変量yを予測する手法である。
【0029】なお、重回帰式(1)において、a0は定
数項と呼ばれ、a1乃至aQは回帰係数(偏回帰係数)と
呼ばれる。
【0030】いま、次のようなI組の、説明変量として
の原因から、目的変量としての結果が得られた場合を考
える。
【0031】 目的変量y1←説明変量x11,x21,・・・,xQ1 目的変量y2←説明変量x12,x22,・・・,xQ2 ・ ・ ・ 目的変量yi←説明変量x1i,x2i,・・・,xQi ・ ・ ・ 目的変量yI←説明変量x1I,x2I,・・・,xQI
【0032】最も誤差の少ない、目的変量yの予測値Y
を与える重回帰式(1)を求めるということは、式|y
−Y|が小さくなるように、回帰係数a1乃至aQおよび
定数項a0を求めるということになる。
【0033】説明変量xqiに対する予測値Yiは、式
(1)から式 Yi=a0+a11i+a22i+・・・+aQQi によって与えられ、従ってその目的変量yiと予測値Yi
との誤差Eiは、式 Ei=|yi−(a0+a11i+a22i+・・・+aQQi)| (2) によって与えられる。
【0034】式(2)を最小にするa0乃至aQを求める
には、最小自乗法に基づき、次式で示される自乗誤差ε
を最小にするa0乃至aQを求めれば良い。 ε=ΣEi 2 但し、Σは、i(=1,2,・・・,I)に関するサメ
ーションを意味する。
【0035】この場合、自乗誤差εを、a0乃至aQで偏
微分し、その結果得られるQ+1個の式をそれぞれ0と
おいて、Q+1個の連立方程式を解くことにより、自乗
誤差εを最小にするa0乃至aQを求めることができる。
これは、次のようにして得られる連立方程式を解くこと
に等しいことが知られている。
【0036】即ち、説明変量xqiとxpiとの共分散をs
qp(但しp=1,2,・・・Q)、説明変量xqiと目的
変量yiとの共分散をsqy、説明変量xqiの平均値をx'
q、目的変量yiの平均値をy'とすると、連立方程式 s1 21+s122+・・・+s1QQ=s1y211+s2 22+・・・+s2QQ=s2y ・ ・ ・ sQ11+sQ22+・・・+sQ 2Q=sQy0=y'−(x'11+x'22+・・・+x'QQ) (3) を解くことによって、a0乃至aQを求めることができ
る。
【0037】なお、sq 2は、xqiとxqiとの共分散
qq、即ちxqiの分散を表す。また、sqp=spqである
ので、連立方程式(3)を得るにあたっては、すべての
pとqについてsqpを求めるのではなく、sqpおよびs
pqのうちのいずれか一方を求めれば良い。
【0038】加重パラメータ変換部2で用いる変換関数
としての重回帰式を求めるにあたっては、まず学習系列
としての、音韻ラベルのふられている音声信号を、音響
分析部1で、上述したようにして音響分析し、Q次まで
のLPCケプストラム係数xqを求める。
【0039】また、LPCケプストラム係数xqを求め
た音声信号に対応する口形状を有する顔画像を、例えば
ビデオテープなどに録画しておき、その再生顔画像の口
形状を得ることができる、図3に示す4つの口形状オブ
ジェクトそれぞれの加重パラメータw1乃至w4を求め
る。
【0040】これにより、ある音韻が発声されている時
刻tにおける、LPCケプストラム係数xqと、加重パ
ラメータw1乃至w4とを対応付けることができる。
【0041】ここで、学習系列としての音声信号は、装
置を日本語に適用する場合、複数の話者について、日本
語の音韻の組み合わせをできるだけ多く含む単語セット
または文章セットを用いるようにする。
【0042】以上のようにして対応付けたLPCケプス
トラム係数xqと加重パラメータw1乃至w4とを、それ
ぞれ説明変量と目的変量とし、目的変量としての加重パ
ラメータw1乃至w4それぞれに対する、式(3)に対応
する連立方程式をたてる。
【0043】そして、その連立方程式を解くことによ
り、説明変量としてのLPCケプストラム係数xqを、
目的変量としての加重パラメータw1乃至w4の予測値W
1乃至W4にそれぞれ変換する重回帰式としての変換関数 W1=a0W1+a1W11+a2W12+・・・+aQW1Q2=a0W2+a1W21+a2W22+・・・+aQW2Q3=a0W3+a1W31+a2W32+・・・+aQW3Q4=a0W4+a1W41+a2W42+・・・+aQW4Q (4) を得る。
【0044】加重パラメータ変換部2では、音響分析部
1から時系列に出力されるLPCケプストラム係数xq
が、式(4)に示す変換関数によって加重パラメータW
1乃至W4にそれぞれ変換され、顔画像合成器3に順次出
力される。
【0045】そして、顔画像合成器3においては、上述
したように、加重パラメータ変換部2から時系列に出力
される加重パラメータW1乃至W4それぞれに基づいて、
「あ」、「い」、「う」、口を閉じた形を表現する口形
状オブジェクトN1乃至N4を混合(多重内挿)する割合
を変えることにより、音響分析部1に入力された音声に
同期して口形状の変化するアニメーションが生成され
る。
【0046】以上のように、重回帰分析によって得られ
た重回帰式としての変換関数を用いるようにしたので、
線形演算で、音声の音響パラメータとしてのLPCケプ
ストラム係数を加重パラメータに変換することができ
る。さらに、その演算量は少なくて済み、これにより、
処理の高速化、装置の小型化、低コスト化を図ることが
できる。
【0047】従って、本発明を、例えば音声入出力イン
ターフェイスを装備しているワークステーションなどに
適用しても、ソフトウェア処理だけで、口形状の変化す
るアニメーション生成のリアルタイム処理を行うことが
可能となる。
【0048】さらに、本発明を、例えばボイスメールの
読み上げ処理や、演算能力の低いコンピュータなどに適
用する場合においては、口以外の顔画像を合成するため
のパラメータをあらかじめ計算しておくようにすること
により、即ち口以外の部分の顔画像を完成しておくよう
にすることにより、入力音声に同期して口の動く顔画像
生成のリアルタイム処理を行うことが可能となる。
【0049】また、本発明においては、自然音声(実際
に発声された音声)から得られたLPCケプストラム係
数を変換した加重パラメータを用いるようにしたので、
口形状の変化が、自然なアニメーションを得ることがで
きる。
【0050】さらに、本発明においては、口形状が段階
的に変化する複数のセル画を描くことなく、声優が発し
た声に同期して口形状の変化するアニメーションを容易
に制作することができる。
【0051】なお、本実施例においては、本発明を、ア
ニメーション制作に適用した場合について説明したが、
本発明は、この他、例えばコンピュータグラフィクスな
どのアプリケーション(例えば、上述のボイスメールの
読み上げ処理など)などにも適用することができる。
【0052】また、本実施例では、加重パラメータに変
換する音声の音響パラメータとして、LPCケプストラ
ム係数を用いるようにしたが、その他のあらゆる音響パ
ラメータを用いるようにすることができる。
【0053】即ち、例えば音声をFFT(高速フーリエ
変換)してスペクトル分析した分析結果や、音声をBP
F(バンドパスフィルタ)でフィルタリングし、そのフ
ィルタ出力を全波整流平滑化したものをサンプリングし
た値(バンドパスフィルタバンク分析結果)(各BPF
の通過帯域における音声のパワーの平均値)などを用い
るようにすることができる。
【0054】さらに、音響パラメータとしては、例えば
フォルマントなどを用いるようにしても良いが、上述し
たLPCケプストラム係数や、FFTによるスペクトル
分析結果、バンドパスフィルタバンク分析結果などのよ
うに、音声のスペクトル包絡特性を表す音響パラメータ
を用いる方が、その抽出精度が良く、また高速且つ安定
な音響分析を行うことができるので、より正確な口形状
のアニメーションを実現することができる。
【0055】即ち、例えば子音の正確なフォルマントを
抽出することは困難であるが、子音から抽出したLPC
ケプストラム係数などのスペクトル包絡特性を表す音響
パラメータは、ある程度正確に、その子音の特徴を表
す。従って、音声のスペクトル包絡特性を表す音響パラ
メータを用いる方が、フォルマントなどを用いる場合に
比較して、より正確な口形状の変化が反映されることに
なる。
【0056】
【発明の効果】以上の如く、本発明によれば、音声を音
響分析し、音響パラメータを算出して、重回帰分析によ
ってあらかじめ求められた、音響パラメータを、画像の
口形状を変化させるための加重パラメータに変換する変
換関数によって、加重パラメータに変換する。そして、
加重パラメータに基づいて、あらかじめ設定された基本
口形状を変化させ、画像を作成する。従って、音声に同
期して口形状の変化する画像を、少ない演算量によって
得ることができる。
【図面の簡単な説明】
【図1】本発明を適用した音声顔画像同期装置の一実施
例の構成を示すブロック図である。
【図2】音響分析部1に入力される音声の例を示す波形
図である。
【図3】口形状オブジェクトを示す図である。
【図4】図2の音声波形に対し、加重パラメータ変換部
2から時系列に出力される加重パラメータを示す図であ
る。
【図5】顔画像合成器3の動作を説明するための図であ
る。
【符号の説明】
1 音響分析部 2 加重パラメータ変換部 3 顔画像合成器

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声に同期した画像を作成す
    る画像作成方法において、 前記音声から抽出した音響パラメータを、前記画像の口
    形状を変化させるための加重パラメータに変換する変換
    関数を、重回帰分析によってあらかじめ求めておき、 前記変換関数によって、前記音響パラメータを前記加重
    パラメータに変換し、 前記加重パラメータに基づいて、あらかじめ設定された
    基本口形状を変化させ、前記画像を作成することを特徴
    とする画像作成方法。
  2. 【請求項2】 前記基本口形状は、「あ」、「い」、お
    よび「う」を発音する口形状、並びに口を閉じた形の口
    形状でなることを特徴とする請求項1に記載の画像作成
    方法。
  3. 【請求項3】 入力された音声に同期した画像を作成す
    る画像作成装置において、 前記音声を音響分析し、音響パラメータを算出する分析
    手段と、 重回帰分析によってあらかじめ求められた、前記音響パ
    ラメータを、前記画像の口形状を変化させるための加重
    パラメータに変換する変換関数によって、前記音響パラ
    メータを前記加重パラメータに変換する変換手段と、 前記加重パラメータに基づいて、あらかじめ設定された
    基本口形状を変化させ、前記画像を作成する作成手段と
    を備えることを特徴とする画像作成装置。
  4. 【請求項4】 前記基本口形状は、「あ」、「い」、お
    よび「う」を発音する口形状、並びに口を閉じた形の口
    形状でなることを特徴とする請求項3に記載の画像作成
    装置。
JP5184260A 1993-07-27 1993-07-27 画像作成方法およびその装置 Withdrawn JPH0744727A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5184260A JPH0744727A (ja) 1993-07-27 1993-07-27 画像作成方法およびその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5184260A JPH0744727A (ja) 1993-07-27 1993-07-27 画像作成方法およびその装置

Publications (1)

Publication Number Publication Date
JPH0744727A true JPH0744727A (ja) 1995-02-14

Family

ID=16150208

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5184260A Withdrawn JPH0744727A (ja) 1993-07-27 1993-07-27 画像作成方法およびその装置

Country Status (1)

Country Link
JP (1) JPH0744727A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100343006B1 (ko) * 2000-06-01 2002-07-02 김상덕 언어 입력형 얼굴 표정 제어방법
JP2003529861A (ja) * 2000-03-31 2003-10-07 テレコム・イタリア・ラブ・エツセ・ピー・アー 音響信号により駆動される人間の顔の合成モデルのアニメ化方法
US6699123B2 (en) 1999-10-14 2004-03-02 Sony Computer Entertainment Inc. Entertainment system, entertainment apparatus, recording medium, and program
JP2008140364A (ja) * 2006-07-24 2008-06-19 Advanced Telecommunication Research Institute International リップシンクアニメーション作成装置、コンピュータプログラム及び顔モデル生成装置
JP2009087328A (ja) * 2007-09-10 2009-04-23 Advanced Telecommunication Research Institute International リップシンクアニメーション作成装置、コンピュータプログラム及び顔モデル生成装置
EP2293221A2 (en) 2009-08-31 2011-03-09 Sony Corporation Apparatus, method, and program for processing image
JP2011516954A (ja) * 2008-03-31 2011-05-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ユーザ命令に基づいて表示を変更する方法
US8306824B2 (en) 2008-10-14 2012-11-06 Samsung Electronics Co., Ltd. Method and apparatus for creating face character based on voice

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6699123B2 (en) 1999-10-14 2004-03-02 Sony Computer Entertainment Inc. Entertainment system, entertainment apparatus, recording medium, and program
JP2003529861A (ja) * 2000-03-31 2003-10-07 テレコム・イタリア・ラブ・エツセ・ピー・アー 音響信号により駆動される人間の顔の合成モデルのアニメ化方法
JP4913973B2 (ja) * 2000-03-31 2012-04-11 テレコム・イタリア・エッセ・ピー・アー 音響信号により駆動される人間の顔の合成モデルのアニメ化方法
KR100343006B1 (ko) * 2000-06-01 2002-07-02 김상덕 언어 입력형 얼굴 표정 제어방법
JP2008140364A (ja) * 2006-07-24 2008-06-19 Advanced Telecommunication Research Institute International リップシンクアニメーション作成装置、コンピュータプログラム及び顔モデル生成装置
JP2009087328A (ja) * 2007-09-10 2009-04-23 Advanced Telecommunication Research Institute International リップシンクアニメーション作成装置、コンピュータプログラム及び顔モデル生成装置
JP2011516954A (ja) * 2008-03-31 2011-05-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ユーザ命令に基づいて表示を変更する方法
US8306824B2 (en) 2008-10-14 2012-11-06 Samsung Electronics Co., Ltd. Method and apparatus for creating face character based on voice
EP2293221A2 (en) 2009-08-31 2011-03-09 Sony Corporation Apparatus, method, and program for processing image
US8634658B2 (en) 2009-08-31 2014-01-21 Sony Corporation Apparatus, method, and program for processing image

Similar Documents

Publication Publication Date Title
Banbrook et al. Speech characterization and synthesis by nonlinear methods
US6760703B2 (en) Speech synthesis method
JP2763322B2 (ja) 音声処理方法
JP3266819B2 (ja) 周期信号変換方法、音変換方法および信号分析方法
CN108108357B (zh) 口音转换方法及装置、电子设备
CN110648684B (zh) 一种基于WaveNet的骨导语音增强波形生成方法
JPH0677200B2 (ja) デジタル化テキストの音声合成用デジタルプロセッサ
Meseguer Speech analysis for automatic speech recognition
JP2017151230A (ja) 音声変換装置および音声変換方法ならびに計算機プログラム
JPH0772900A (ja) 音声合成の感情付与方法
JPH0744727A (ja) 画像作成方法およびその装置
Yadav et al. Prosodic mapping using neural networks for emotion conversion in Hindi language
CN102231275A (zh) 一种基于加权混合激励的嵌入式语音合成方法
JP7079455B1 (ja) 音響モデル学習装置、方法およびプログラム、並びに、音声合成装置、方法およびプログラム
Wang et al. Beijing opera synthesis based on straight algorithm and deep learning
Deiv et al. Automatic gender identification for hindi speech recognition
JPH05281984A (ja) 音声合成方法および装置
Singh et al. A Hybrid Deep Learning Model for Emotion Conversion in Tamil Language
Ademi et al. Natural language processing and text-to-speech technology
Ramli et al. An iterated two-step sinusoidal pitch contour formulation for expressive speech synthesis
JPH0756590A (ja) 音声合成装置、音声合成方法及び記録媒体
Anil et al. Expressive speech synthesis using prosodic modification for Marathi language
JPH05127697A (ja) ホルマントの線形転移区間の分割による音声の合成方法
Smruti et al. An approach to design an intelligent parametric synthesizer for emotional speech
Karki et al. Advancing Voice Cloning for Nepali: Leveraging Transfer Learning in a Low-Resource Language

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20001003