JP2004021028A - Voice interaction device and voice interaction program - Google Patents
Voice interaction device and voice interaction program Download PDFInfo
- Publication number
- JP2004021028A JP2004021028A JP2002177301A JP2002177301A JP2004021028A JP 2004021028 A JP2004021028 A JP 2004021028A JP 2002177301 A JP2002177301 A JP 2002177301A JP 2002177301 A JP2002177301 A JP 2002177301A JP 2004021028 A JP2004021028 A JP 2004021028A
- Authority
- JP
- Japan
- Prior art keywords
- answer
- sentence
- guidance
- slot
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003993 interaction Effects 0.000 title claims description 18
- 230000004044 response Effects 0.000 claims abstract description 19
- 238000000034 method Methods 0.000 claims description 19
- 230000014509 gene expression Effects 0.000 claims description 15
- 238000012790 confirmation Methods 0.000 abstract description 30
- 238000010586 diagram Methods 0.000 abstract description 5
- 230000002452 interceptive effect Effects 0.000 description 10
- 241000245665 Taraxacum Species 0.000 description 9
- 235000005187 Taraxacum officinale ssp. officinale Nutrition 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
Images
Abstract
【課題】対話装置からのガイダンスによる質問、確認に対して、ユーザが無効な発話を行った場合や、装置が誤認識し、再度同一内容のガイダンスが必要となった場合、ユーザが不快感を抱かないようなガイダンス文を生成すること。
【解決手段】回答文から、ガイダンス文が目的とした回答が得られたか否かを判断する判断手段と、判断手段により目的の回答が得られなかったと判断された場合には、その目的とする回答を得るための他の異なるガイダンス文を音声出力して、発話者に再度、回答文を要求する再要求手段とを有するようにした。
【選択図】 図1An object of the present invention is to provide a user with discomfort when a user makes an invalid utterance in response to a question or confirmation by a guidance from a dialogue device, or when the device misrecognizes and needs the same content again. Generate guidance sentences that you do not hold.
SOLUTION: From an answer sentence, a judging means for judging whether or not a target answer of a guidance sentence has been obtained, and, when it is judged by the judging means that a target answer could not be obtained, the object is set as the target Another different guidance sentence for obtaining an answer is output as voice, and a re-requesting means for requesting the speaker again for the answer sentence is provided.
[Selection diagram] Fig. 1
Description
【0001】
【発明の属する技術分野】
本発明は、発話者から目的とする回答を得るためにガイダンス文を音声出力し、このガイダンス文に応答して発話者から得られる回答文を解析して目的とする回答を確定する音声認識装置に関する。したがって、本発明は例えば、車載用のカーナビゲーション・システム等に応用可能で、例えば目的地の施設名称や住所などの、所謂「スロット」に該当する情報を埋めていくような対話を行う音声対話装置等に適用することができる。
【0002】
【従来の技術】
発話者から目的とする回答を得るためにガイダンス文を音声出力し、このガイダンス文に応答して発話者から得られる回答文を解析して目的とする回答を確定する音声認識装置としては、一例として、公開特許公報「特開平10−20884:音声対話装置」に記載されている音声対話装置が知られている。発話者からよりスムーズに回答を得るために、ガイダンス文をより分かりやすいものにしたり、特開平10−20884による音声対話装置においては、ユーザが音声を入力するまでの時間や、正しい認識結果の割合、対話の流れから、ユーザの熟練度を推定し、熟練度に応じて、複数の異なる表現を用いた音声ガイダンスを自動的に選択する方法が取られている。
【0003】
【発明が解決しようとする課題】
上記、特開平10−20884による音声対話装置では、目的とする回答を得るために複数のガイダンスを用意しているが、これは、ユーザの熟練度のみを考慮して、ガイダンス文の変更を行っている。つまり、誤認識した場合などの繰り返されるガイダンスに関しては、考慮されていない。つまり、従来の音声対話装置では、誤認識をした場合、認識できなかった場合などは、同一のガイダンス文が繰り返されていた。従って、ユーザは、正しい回答をしているにもかかわらず、音声対話装置の誤認識により、発話が無効となる場合もある。このような場合、音声対話装置は、再度、同一の内容のガイダンスを行う必要がある。
【0004】
従来装置では、同一のガイダンス文を繰り返すため、ユーザは、装置に対して「融通の聞かない装置」といった不快感を抱くことになる。又、ユーザにとって、聞き取り難いガイダンス文であった場合、同一のガイダンス文を繰り返されても判り辛く、結局、ユーザから、音声対話装置の目的とする回答が得られないという問題もあった。本発明は、このようなユーザの音声対話装置に対する不快感を低減することを目的としている。又、本発明の更なる目的は、ユーザと、音声対話装置の円滑な音声対話を実現させることである。
【0005】
本発明は、上記の課題を解決する為になされたものであり、その目的は、ユーザに不快感を抱かせず、音声対話装置との円滑な音声対話を実現させ目的とする回答を得ることである。
【0006】
なお、上述したある1つの発明が、上記した全ての目的を同時に達成するものと解されるべきではなく、個々の発明が、それぞれの目的を達成するものと解されるべきである。
【0007】
【課題を解決するための手段】
上記課題を解決する為に、請求項1の音声対話装置においては、発話者から目的とする回答を得るためにガイダンス文を音声出力し、このガイダンス文に応答して発話者から得られる回答文を解析して目的とする回答を確定する音声対話装置において、回答文から、ガイダンス文が目的とした回答が得られたか否かを判断する判断手段と、判断手段により目的の回答が得られなかったと判断された場合には、その目的とする回答を得るための他の異なるガイダンス文を音声出力して、発話者に再度、回答文を要求する回答文再要求手段とを有することを特徴とする。つまり、音声対話装置が、目的とする回答が得られなかった場合は、目的とする回答を得るために、異なるガイダンス文を音声出力し、再度発話者の回答を要求するようにした。
【0008】
さらに、請求項2の発明は、発話者から、音声対話装置が目的とする回答を得るために音声出力されるガイダンス文は、異なるカテゴリー毎に設けられた少なくとも1つのスロットに目的の回答を得るために、発話者に回答文を促す文であり、回答を求める少なくとも1つのスロット毎に、異なる複数のガイダンス文が音声出力されることを特徴とする。
【0009】
さらに、請求項3の発明は、異なるガイダンス文を出力するために、少なくとも1つのスロット毎に複数のガイダンス文を記憶した記憶手段を有し、回答文再要求手段は、回答を求める少なくとも1つのスロットに対応した複数のガイダンス文を、記憶手段から順次選択して音声出力することを特徴とする。
【0010】
さらに、請求項4の発明は、回答を求める少なくとも1つのスロット毎に設定されている複数のガイダンス文の集合は、そのスロットの目的とする回答を引き出すために、異なる表現のガイダンス文の集合から成ることを特徴とする。
【0011】
さらに、請求項5の発明の音声対話プログラムは、音声対話装置のコンピュータにおいて、発話者から目的とする回答を得るためにガイダンス文を音声出力する手順と、ガイダンス文に応答して発話者から得られる回答文を解析し、回答文から、ガイダンス文が目的とした回答が得られたか否かを判断する判断手順と、判断手順により目的の回答が得られなかったと判断された場合には、その目的とする回答を得るための他の異なるガイダンス文を生成しガイダンス文を音声出力し発話者に再度、回答文を要求する回答文再要求手順とを有することを特徴とする。
【0012】
さらに、請求項6の発明の音声対話プログラムは、音声対話装置のコンピュータにおいて、回答文再要求手順は、異なるカテゴリ毎に設けられた少なくとも1つのスロットに目的の回答を得るために、回答を求める少なくとも1つのスロット毎に異なる複数のガイダンス文を音声出力する手順をさらに有することを特徴とする。
【0013】
【発明の作用、効果】
本欄では、各請求項に記載の発明に関して、主としてその作用及び効果を記載する。発明の理解を容易にするために、例示的に具体化して説明しているが、請求項の構成を限定するものではない。そして、例示的に具体化して説明した部分は、発明の実施の形態の説明でもある。
【0014】
まず、請求項1の発明は、発話者から目的とする回答を得るためにガイダンス文を音声出力し、このガイダンス文に応答して発話者から得られる回答文を解析して、ガイダンス文が目的とした回答が得られたか否かを判断する判断手段を有するようにしたので、ガイダンス文に対して、回答が得られたかどうかが判断できるようになる。判断の結果、目的の回答が得られなかったと判断された場合には、その目的とする回答を得るための他の異なるガイダンス文を音声出力して、発話者に再度、回答文を要求する回答文再要求手段を有するようにしたので、回答が得られ無かった時は、回答文再要求手段により、前回と異なるガイダンス文が、音声出力されるようになる。この結果、ユーザの不快感が低減されるようになる。さらに、異なる表現であるため、何を答えたらよいか分かりやすくなるという効果もある。例えば、音声対話装置が「店名」について質問し、それに対してユーザが応答する。ここでは、ユーザが、誤った回答をしたために、有効な回答が得られなかったとする。
対話装置:「お店の名前を教えてください。」
ユーザ :「レストランです。」
認識結果:「レストラン です。」
これは、業種であり、ガイダンスが目的とする回答である店名ではないので、再度質問をする必要があるので、直前のガイダンス文とは異なるガイダンス文が出力されるようになる。
対話装置:「なんと言うお店でしょうか?」
ユーザ :「タンポポです。」
認識結果:「タンポポ です。」
のように、異なるガイダンス文が音声出力されるので、ユーザは、装置から、問い直されても、不快感を抱くことが少なくなり、さらに、何を答えなければいけないのか、理解し易くなる。このように、期待する回答が得られないときに、表現を変えるということは、人対人の会話では、極自然に行われることである。従って、装置との対話であっても、違和感を抱くことなく円滑に対話を進めることができるようになる。
【0015】
さらに、請求項2の発明は、音声対話装置の目的である、異なるカテゴリー毎に設けられた少なくとも1つのスロットに目的の回答を得るために、発話者に回答文を促す文であるガイダンス文は、回答を求める少なくとも1つの目的のスロット毎に、異なる複数のガイダンス文が音声出力されるようにしたので、目的のスロットに応じた複数の異なるガイダンス文を音声出力できるようになる。
【0016】
さらに、請求項3の発明は、少なくとも1つのスロット毎に複数のガイダンス文を記憶手段に記憶できるようにし、回答文再要求手段により、回答を求める少なくとも1つのスロットに対応した複数のガイダンス文を、記憶手段から順次選択して音声出力できるようにしたので、直前のガイダンス文が求めた回答と同じ回答を求める場合でも、直前のガイダンス文とは異なるガイダンス文を音声出力できるようになる。このように記憶手段から、順次選択して、音声出力できるようにすることにより、例えば、ガイダンス文の表現を選択する順に、最初のガイダンス文の表現は一般的なもの。次のガイダンス文は、簡潔さより、少し分かり易さ重視の表現を用いたもの。といったランク付けをしたガイダンス文を出力することもできるようになる。つまり、次のガイダンス文の表現は、さらに分かり易さを重視した表現のもの。つまり、ガイダンス文に、求められる分かり易さと、簡潔さは、相反するものであり、どちらかに重きをおけば、どちらかが犠牲となる。しかし、異なる表現のガイダンス文を順次選択して、音声出力することができるので、ガイダンスを繰り返す毎に、異なる比重のガイダンス文を用意することもできるようになる。これにより、不慣れなユーザであっても、同じガイダンス文を繰り返され、良く分からない、融通の利かない装置といった不快感を抱くことなく、装置を利用できるようになる。
【0017】
さらに、請求項4の発明は、回答を求める少なくとも1つのスロットの目的とする回答を引き出すために、表現の異なるガイダンス文の集合から成る様に、それぞれの回答を求める少なくとも1つのスロット毎に設定されている複数のガイダンス文のを構成したので、目的とするスロットに対する回答を得るために、異なる表現のガイダンスを音声出力できるようになる。
【0018】
さらに、請求項5の発明のプログラムは、上述した音声対話装置にインストールして用いると、上述した音声対話装置において、発話者から目的とする回答を得るためにガイダンス文を音声出力できるようになり、さらに、ガイダンス文に応答して発話者から得られる回答文を解析し、回答文から、ガイダンス文が目的とした回答が得られたか否かを判断する判断できるようになる。さらに、目的の回答が得られなかったと判断された場合には、その目的とする回答を得るための他の異なるガイダンス文を生成しガイダンス文を音声出力し発話者に再度、回答文を要求することができるようになる。
【0019】
さらに、請求項6の発明のプログラムは、上述した音声対話装置にインストールして用いると、異なるカテゴリ毎に設けられた少なくとも1つのスロットに目的の回答を得るために、回答を求める少なくとも1つのスロット毎に異なる複数のガイダンス文を音声出力することができるようになる。
【0020】
【発明の実施の形態】
以下、本発明を具体的な実施例に基づいて説明する。ただし、本発明は、以下に示す実施例に限定されるものではない。
【0021】
ここでは、カーナビゲーションシステムにおける目的地設定を対象タスクとした対話を例に説明する。
【0022】
このタスクでは、音声対話装置は、目的地設定に必要な3つの目的スロット、「店名」、「住所」、「業種」についてユーザに質問し、ユーザからの回答に対して確認を行う。ここでは、次の質問ガイダンスに直前の認識結果を入れることによって、質問と同時に、直前の認識結果の確認(暗黙的な確認)を行うものとする。
【0023】
ガイダンス生成部では、質問すべきスロット(質問スロット)、確認すべきスロット(確認スロット)の組み合わせからなるガイダンススロットに対応して、複数の異なる表現からなるガイダンス文テンプレート(図3)が、ガイダンス記憶部171に記憶されており、該当する質問スロットと、確認スロットに組み合わせに対応するテンプレートのグループから選択され、ガイダンスの生成に用いられるものとする。
【0024】
図1は、本発明の実施例に係わる音声対話装置100の論理的な構成を例示する構成図である。
【0025】
音声対話装置100は、主に、音声入力部110と、音声認識部120と、意味理解部130と、対話制御部140と、ガイダンス生成部150と、音声出力部160、データベース170等から構成されている。勿論、音声対話装置100は、物理的なハードウエア構成としては、周知の音声対話装置と同様に、音声入力部110が有するマイクや、音声出力部160が有するスピーカー等のマンマシン・インターフェイス部を備えたコンピュータ・システムにより具現されている。
【0026】
音声認識部120は、発話者の発話音声を文字列として認識する。即ち、マイク(音声入力部110)から入力された音声情報を、音声認識用辞書(認識用言語辞書や認識用音響辞書等)を用いた音声認識処理により文字列に変換する。
【0027】
意味理解部130は、主に、単語抽出部131、単語判断部132等から構成されている。これらにより、上記の文字列の中から必要なキーワード(スロット値となる単語)を抽出し、その単語がガイダンスが目的とした単語かどうか判断し、目的とした単語であれば、各スロットへ、スロット値として保持する。具体的には、単語抽出部131は、音声認識結果として出力された文字列から、スロット値となる様な単語をデータベース170に記憶された単語辞書等を利用して抽出する。単語判断部132は、抽出された単語が、ガイダンスによる目的単語であるかどうか判断する。判断するには、例えば、抽出された単語のカテゴリーを単語辞書、或いはスロット値候補単語リスト等を利用して同定し、ガイダンスが想定しているカテゴリーに属するか判断することにより、目的単語であるかどうか判断する。カテゴリーとしては、例えば、住所、地名、施設の種類、店名、業種、施設名、ランドマーク名、或いはユーザ設定名等の任意の属性を定義することができる。判断の結果、目的単語であると判断すると、ガイダンスが目的としたスロットへ、スロット値として保持する。又、「はい」、「いいえ」といった回答の場合は、該当するスロットのスロット状態を進展、又は後退させる様に更新する。また、暗黙の確認に対しては、否定を表す単語がなければ、確認されたとし、スロット状態を更新する。スロット状態とは、例えば、スロット値が何も保持されていない状態は、スロット値を得るために質問すべきスロット(質問スロット)である。質問スロットである状態を「質問」状態。対話により、スロット値となる単語が保持されているが、確認されておらず、確認すべきスロット(確認スロット)である状態を「確認」状態。スロット値を確認した状態を「確定」 状態と呼ぶ。
【0028】
対話制御部140は、次に尋ねるべき質問項目又は確認項目を決定し、対話の流れを制御し、対話の進展により、保持されたスロット値に対して、スロット状態が、推移し、すべてのスロットが、「確定」 状態になるまで、対話を行う。
【0029】
回答文再要求部141においては、テンプレート番号を更新することにより、直前のガイダンス文と同一のガイダンス文とならないように制御する。
【0030】
ガイダンス生成部150は、発話者(ユーザ)に対する応答文(確認応答文や質問応答文等)を生成し、更に、その応答文(単語列)を音響的なデジタル信号(音声情報)に変換・合成する。ただし、この変換・合成処理は、以下に例示する様に、音声出力部160が行う用にしても良い。ガイダンス文を生成するには、具体的には、図2(b)ガイダンス文スロットを参照することにより、確認スロット、質問スロットの組み合わせを得る。さらに、テンプレート番号を得ることにより、直前のガイダンス文とは異なるガイダンス文を生成するテンプレート番号を得る。その後、確認スロット、質問スロットに保持されている「店名」 、「住所」、「業種」 により、目的スロットを参照し、ガイダンス文を生成する。
【0031】
データベース150は、主に、音声認識用辞書、単語辞書、スロット値候補単語リスト、音声合成用辞書、及びガイダンス記憶部171に記憶されたガイダンス文テンプレート(図3)等から構成されている。
(a)音声認識用辞書
認識用言語辞書や認識用音響辞書等からなる。
(b)単語辞書
カテゴリー、関連カテゴリー、その他の属性、発音情報等を有する。
(c)スロット値候補単語リスト
候補単語リスト。単語とその単語のカテゴリーの対から構成されたテーブル。
(d)音声合成用辞書
発話の抑揚、単語接続、間などに関する音声合成用の発音規則を有する。
(e) ガイダンス文テンプレート(図3)
確認スロット、質問スロットの対に対応したテンプレート番号の付された複数のガイダンス文のテンプレートからなる。
【0032】
図4は、上記の音声対話装置100が実行する処理の手順を例示するフローチャートである。本手順では、まず最初に、ステップ400により初期処理を実行し、目的スロット、対話状態、ガイダンス文スロット、テンプレート番号の初期化を行う。本処理では、データベース170の中から使用頻度が高いと予期されるプログラム及びデータを、比較的アクセス速度の高いメモリー上にローディングしておく等の初期処理を実行する。例えば、音声対話装置100がディスプレイ装置(図略)を有する場合等には、例えば初期メニュー画面を表示する等のその他の初期処理を行っても良い。
【0033】
ステップ402において、ガイダンス生成部150において、ガイダンス文が生成される。ガイダンス文の生成は、図2(b)に示すガイダンス文スロットを参照することにより、「確認スロット」と、「質問スロット」の組み合わせと、「テンプレート番号」を得る。この、「確認スロット」と、「質問スロット」の組み合わせと、「テンプレート番号」により、ガイダンス文テンプレートから、ガイダンス文テンプレートを選択する。
【0034】
初期状態としては、まず、すべての目的スロットは、スロット値を保持していないので、確認すべきスロットはない。まず、店名を尋ねるので、「質問スロット」に「店名」が保持されており、テンプレート番号としては、初期値として、1がセットされている。従って、ガイダンス生成部では、「確認スロット」が、「空」、「質問スロット」が「店名」のテンプレート番号「1」のガイダンス文テンプレートが選択される。ここでは、次のようなガイダンス文が用意される。例: 対話装置:「お店の名前を言ってください。」
【0035】
次に、ステップ404において、音声出力部160において、ステップ402において生成されたガイダンス文が音響的なデジタル信号(音声情報)に変換・合成され、スピーカーに音声として出力される。
【0036】
ステップ406において、音声入力部110において、マイク(音声入力部110)から発話者の音声を音声情報として取り込む。
【0037】
ステップ408において、音声認識部120において、音声情報を音声認識用辞書(認識用言語辞書や認識用音響辞書等)を用いて、文字列に変換する。
【0038】
ステップ410において、意味理解部130の単語抽出部131において、上記の文字列の中から必要な単語(スロット値となる単語)を抽出し、その単語のカテゴリーを同定する。次に、ステップ412において、単語判断部132により目的単語であるかどうか判断する。目的単語であった場合は、ステップ414へ進み、抽出単語が、目的スロットのスロット値としての単語であれば、目的スロットへ抽出単語をスロット値として保持し、スロット状態を更新する。又、目的単語が、「はい」「いいえ」などの確認単語であれば、必要に応じて、スロット値の消去、及び、スロット状態の更新を行う。同時に、テンプレート番号の初期化を行い「0」をセットする(判断手段)。
【0039】
ステップ416において、対話制御部140において、目的スロットは、全て「確定」状態になったか判断する。確定状態と判断されると、ステップ420において、終了ガイダンスが出力され音声対話装置の処理を終了する。一方、目的スロットが、まだ、確定していないと判断されると、ステップ418において、スロット状態により、ガイダンス文スロットの設定、テンプレート番号の更新を行う。ここで、ステップ412において、目的単語で無いと判断されると、スロット状態の更新が行われないので、ステップ418において、直前のガイダンス文と同一の「質問スロット」「確認スロット」の組み合わせとなり、同一の回答を要求するガイダンス文テンプレートのグループが選択される(回答文再要求手段)。しかし、テンプレート番号が、ステップ418において更新されるので、同一のグループのテンプレートの選択であっても、ガイダンス文は異なる表現のガイダンス文テンプレートの選択となる。ステップ402から、ステップ418を繰り返し、全ての目的スロットへスロット値となる単語を設定し、スロット状態を「確定」とする。
【0040】
以下、具体例により、各目的スロットのスロット値、スロット状態、ガイダンススロットの状態を詳しく説明する。
【0041】
(1)音声対話装置が「店名」について質問し、それに対してユーザが応答する。ここでは、音声認識部が正しく認識したとする。
対話装置:「お店の名前を言ってください。」
ユーザ :「タンポポです。」
認識結果:「タンポポ です。」
これにより、「店名スロット」に「タンポポ」が保持され、スロット、「店名スロット」の状態は、「確認」に更新される。ガイダンス文スロットへは、「確認スロット」へ「店名」、「質問スロット」へ「住所」、テンプレート番号は、「0」がセットされる。
【0042】
(2)「店名スロット」に「タンポポ」を保持し、その結果を確認しつつ「住所」を質問するガイダンスを生成する。それに対して、ユーザは、「住所」を答える。ここでは、誤認識し有効な認識結果が得られなかったとする。
対話装置:「タンポポの住所を言ってください。」
ユーザ :「名古屋市です。」
認識結果:「何個 です。」
「住所スロット」に対する有効な認識結果が得られなかったため、スロット値、スロット状態は更新されないが、テンプレート番号は更新されるので、次にガイダンス文テンプレートが選択され、ガイダンス文が生成される。
【0043】
(3)ここでは直前のガイダンス文と、異なる言い回しのガイダンス文を生成する。それに対して、ユーザは、「住所」を答える。ここでは、音声認識部が、正しく認識したとする。
対話装置:「タンポポはどこにあるのでしょうか?」
ユーザ :「名古屋市です。」
認識結果:「名古屋市です。」
「住所スロット」に「名古屋市」を保持し、スロット状態は、「確認」に更新される。「店名スロット」のスロット状態は、「確定」へ更新され、テンプレート番号は、初期化され、「0」がセットされる。ガイダンス文スロットへは、「確認スロット」へ「住所」、「質問スロット」へ「業種」、テンプレート番号は、「0」がセットされる。従って、「住所スロット」その結果を確認しつつ次に「業種」を質問するガイダンスを生成する。
【0044】
(4)ユーザは、「業種」を答える。ここでは、誤認識し、有効な認識結果が得られなかったとする。
対話装置:「名古屋市の何のお店でしょうか?」
ユーザ :「レストランです。」
認識結果:「です えーと です」
「業種」スロットに対する有効な認識結果が得られなかったため、スロット値、スロット状態は、更新されない。ステップ418において、ガイダンス文スロットの設定を行う再に、直前の質問スロットと同一となるが、テンプレート番号が更新される為、同一のガイダンス文とはならない。
【0045】
(5)再度、「業種」を質問するガイダンスが選択されるが、「2」のガイダンス文テンプレートが選択される。それに対して、ユーザは、「業種」を答える。
対話装置:「名古屋市にあるどのような業種でしょうか?」
ユーザ :「レストランです。」
認識結果:「レストラン です」
「業種」スロットに「レストラン」を保持し、スロット状態を「確認」に更新する。さらに、「名古屋市」は「確定」状態へと更新される。テンプレート番号は、初期値「0」がセットされる。ステップ418において、ガイダンス文スロットの設定を行う際にテンプレート番号が更新されるのでテンプレート番号「1」のガイダンス文テンプレートが、ここでは選択される。
【0046】
(6)最後に「業種スロット」に対する確認を行う。それに対してユーザは、「はい」と答え、対話が終了する。
対話装置:「「レストランですか?」
ユーザ :「はい」
認識結果:「はい」
【0047】
ステップ420において出力されるガイダンス文は、例え、目的スロットを参照し、次のようなガイダンス文を出力する。
対話装置:「では、名古屋市のレストランで、タンポポを設定します。」
このように、上記発明を実施することで、上記の音声対話装置を実現することができる。
【0048】
これにより、繰り返し同一内容のガイダンスを行う場合でも、同一のガイダンスを行うことなく、異なる表現のガイダンス文により、ユーザへ回答を促すことができるようになり、ユーザへ不快感を抱かせることなく、より円滑な音声対話装置との会話が期待できるようになる。
【0049】
なお、上述した実施例においては、「店名」「住所」「業種」の3つのスロットを確定する例において説明したが、これ以外の少なくとも1つのスロットを確定するようにしてもよい。さらに、これ以外のスロットを確定するに従い、ガイダンス文テンプレートは、ふさわしいものを用意するようにしてもよい。
【0050】
上記実施例でのガイダンス文テンプレートは1例であるので、これ以外に用意しても良い。
【0051】
さらに、ガイダンス文テンプレートの「質問スロット」「確認スロット」の組み合わせも上述した以外に用意しても良い。「質問スロット」「確認スロット」単独のガイダンス文テンプレートを用意しても良い。
【0052】
さらに、上記実施例では、直前の認識結果を次のガイダンス文に入れることにより、暗黙の確認を行ったが、目的とする回答の内容によっては、1スロット毎に、質問、確認を行うように対話の制御を行っても良い。この場合、用意されるガイダンス文テンプレートは、各目的スロット毎に、質問ガイダンス、確認ガイダンスを複数用意するようにする。さらに、これ以外に必要なガイダンスがあれば、用意しても良い。
【0053】
さらに、上記実施例では、直前に回答を得た1つのスロットについて暗黙の確認を行い、次の1つのスロットについての回答を求める制御による例を示したが、これは、暗黙の確認を求めるスロット、回答を求めるスロット共に、1つとは限らない。必要に応じて、それそれが、単数であっても、複数であっても良い。さらに、少なくとも1つのスロットに付いて確認のみを求める制御であっても、少なくとも1つのスロットに付いて回答のみを求める制御であっても構わない。
【0054】
さらに、上記実施例では、ガイダンス文においても、確認を求めるスロット、回答を求めるスロット共に、1つづつの例を示したが、それそれが、複数であっても、単数であっても、確認スロット及び、質問スロットの制御に対応するガイダンス文であれば良い。従って、必要に応じて、質問、確認のそれぞれ少なくとも1つのスロットに応じたガイダンス文を用意しても良い。
【0055】
さらに、必要に応じて、ガイダンス文スロットの確認スロット、質問スロットも複数用意しても良い。
【0056】
上述した実施形態は、本発明の一例であって、これに限定されるものではなく、発明の本質に照らして、様々な変形例が考えられる。
【図面の簡単な説明】
【図1】本発明の実施例に係わる音声対話装置100の論理的な構成を例示する構成図。
【図2】単語判断部132、回答文再要求部141、ガイダンス生成部150が使用するスロットテーブルの説明図。
【図3】ガイダンス生成部150が使用するガイダンス文テンプレートの説明図。
【図4】音声対話装置100が実行する処理の手順を例示するフローチャート。
【符号の説明】
100 … 音声対話装置
110 … 音声入力部
120 … 音声認識部
130 … 意味理解部
131 … 単語抽出部
132 … 単語判断部
140 … 対話制御部
141 … 回答文再要求部
150 … ガイダンス生成部
160 … 音声出力部
170 … データベース
171 … ガイダンス記憶部[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention provides a voice recognition device that outputs a guidance sentence in order to obtain a target answer from a speaker, analyzes a response sentence obtained from the speaker in response to the guidance sentence, and determines a target answer. About. Therefore, the present invention can be applied to, for example, an on-vehicle car navigation system and the like, and a voice dialogue for performing a dialogue for filling information corresponding to a so-called “slot” such as a destination facility name or address. It can be applied to devices and the like.
[0002]
[Prior art]
An example of a speech recognition device that outputs a guidance sentence in order to obtain a desired answer from a speaker and analyzes the answer sentence obtained from the speaker in response to the guidance sentence to determine a desired answer is an example. As an example, there is known a voice interactive device described in Japanese Patent Laid-Open Publication No. Hei 10-20884: Voice Interactive Device. In order to obtain a smoother answer from the speaker, the guidance sentence can be made easier to understand. In a speech dialogue device disclosed in Japanese Patent Application Laid-Open No. 10-20884, the time required for the user to input a speech, the ratio of a correct recognition result, In this method, a skill level of a user is estimated from a flow of a dialog, and a voice guidance using a plurality of different expressions is automatically selected according to the skill level.
[0003]
[Problems to be solved by the invention]
In the above-described voice dialogue apparatus disclosed in Japanese Patent Application Laid-Open No. H10-20884, a plurality of guidances are prepared in order to obtain a desired answer, but this is done by changing the guidance sentence in consideration of only the user's skill level. ing. That is, repeated guidance such as in the case of erroneous recognition is not considered. That is, in the conventional voice interaction device, the same guidance sentence is repeated when erroneous recognition is not performed or recognition is not performed. Therefore, the utterance may be invalid due to erroneous recognition of the voice interaction device even though the user has given a correct answer. In such a case, the voice interaction device needs to provide the same guidance again.
[0004]
In the conventional device, since the same guidance sentence is repeated, the user has an unpleasant sensation to the device, such as “a device that is inflexible”. Further, when the guidance sentence is difficult for the user to hear, it is difficult to understand even if the same guidance sentence is repeated, and there is also a problem that the user cannot obtain a desired answer of the voice interaction device after all. An object of the present invention is to reduce such discomfort of the user for the voice interaction device. A further object of the present invention is to realize a smooth voice dialogue between a user and a voice dialogue device.
[0005]
The present invention has been made in order to solve the above-described problems, and an object of the present invention is to realize a smooth voice dialogue with a voice dialogue device and obtain a desired answer without causing discomfort to a user. It is.
[0006]
It should be understood that one invention described above is not intended to achieve all the objects described above at the same time, and individual inventions are intended to achieve the respective objects.
[0007]
[Means for Solving the Problems]
In order to solve the above-mentioned problem, in the voice interactive device according to
[0008]
Further, according to the invention of
[0009]
Further, the invention according to
[0010]
Further, according to the invention of claim 4, a set of a plurality of guidance sentences set for each of at least one slot for which an answer is required is derived from a set of guidance sentences of different expressions in order to derive a target answer of the slot. It is characterized by comprising.
[0011]
Further, according to a fifth aspect of the present invention, there is provided a voice dialogue program, wherein a computer of the voice dialogue apparatus outputs a guidance sentence by voice to obtain a desired answer from the speaker, The answer sentence is analyzed, and from the answer sentence, a judgment procedure for judging whether or not the intended answer for the guidance sentence has been obtained.If the judgment procedure indicates that the intended answer was not obtained, the The present invention is characterized in that it has another procedure for generating another different guidance sentence for obtaining a target answer, outputting the guidance sentence as voice, and requesting the speaker again for the answer sentence.
[0012]
Further, in the voice dialogue program according to the invention of claim 6, in the computer of the voice dialogue device, the answer sentence re-requesting procedure seeks an answer in order to obtain a target answer in at least one slot provided for each different category. The method further comprises a step of outputting a plurality of different guidance sentences by voice for at least one slot.
[0013]
Actions and effects of the present invention
This section mainly describes the functions and effects of the invention described in each claim. To facilitate understanding of the present invention, the present invention is exemplarily embodied and described, but does not limit the configuration of the claims. The part concretely described as an example is also an explanation of the embodiment of the invention.
[0014]
First, according to the first aspect of the present invention, a guidance sentence is output by voice in order to obtain a desired answer from a speaker, and an answer sentence obtained from the speaker is analyzed in response to the guidance sentence. Since the determination means is provided for determining whether or not an answer has been obtained, it can be determined whether or not an answer has been obtained for the guidance sentence. If it is determined that the intended answer could not be obtained, another different guidance sentence for obtaining the intended answer is output as a voice, and an answer requesting the speaker to request the answer again. Since a sentence re-requesting means is provided, when an answer is not obtained, a guidance sentence different from the previous sentence is output by the answer sentence re-requesting means. As a result, user discomfort is reduced. Furthermore, since the expressions are different, there is an effect that it is easy to understand what to answer. For example, the spoken dialogue device inquires about “store name”, and the user responds thereto. Here, it is assumed that a valid answer was not obtained because the user made an incorrect answer.
Dialogue device: "Please tell me the name of the store."
User: "Restaurant."
Recognition result: "Restaurant."
This is the type of business, and is not the store name that is the target answer of the guidance, so it is necessary to ask a question again, so that a guidance sentence different from the immediately preceding guidance sentence is output.
Dialogue device: "What kind of store is it?"
User: "It's a dandelion."
Recognition result: "It is a dandelion."
As described above, a different guidance sentence is output as a voice, so that the user is less likely to feel uncomfortable even when asked again from the device, and it is easier to understand what must be answered. In this way, changing the expression when the expected answer is not obtained is a very natural thing in a person-to-person conversation. Therefore, even in the case of a dialogue with the device, the dialogue can be smoothly advanced without feeling uncomfortable.
[0015]
Further, according to the invention of
[0016]
Further, the invention according to
[0017]
Furthermore, in order to derive a target answer of at least one slot for which an answer is required, the invention of claim 4 is set for each at least one slot for which each answer is required so as to be composed of a set of guidance sentences having different expressions. Since a plurality of guidance sentences are configured, guidance of different expressions can be output as voice in order to obtain an answer for a target slot.
[0018]
Further, when the program according to the fifth aspect of the present invention is installed and used in the above-described voice interactive device, the above-mentioned voice interactive device can output a guidance sentence in order to obtain a desired answer from a speaker. Further, it is possible to analyze the answer sentence obtained from the speaker in response to the guidance sentence, and to judge from the answer sentence whether or not the intended answer of the guidance sentence has been obtained. Further, when it is determined that the intended answer was not obtained, another different guidance sentence for obtaining the intended answer is generated, the guidance sentence is output as a voice, and the speaker is requested again for the answer sentence. Will be able to do it.
[0019]
Further, when the program according to the invention of claim 6 is installed and used in the above-described voice interactive device, at least one slot for which an answer is required in order to obtain a target answer in at least one slot provided for each different category. A plurality of different guidance sentences can be output by voice.
[0020]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, the present invention will be described based on specific examples. However, the present invention is not limited to the embodiments described below.
[0021]
Here, a description will be given of an example of a dialogue in which a destination setting in a car navigation system is a target task.
[0022]
In this task, the spoken dialogue apparatus asks the user about three destination slots required for setting a destination, “shop name”, “address”, and “industry type”, and confirms an answer from the user. Here, it is assumed that the immediately preceding recognition result is confirmed (implicit confirmation) simultaneously with the question by putting the immediately preceding recognition result into the next question guidance.
[0023]
In the guidance generation unit, a guidance sentence template (FIG. 3) having a plurality of different expressions is stored in the guidance storage corresponding to the guidance slot including the combination of the slot to be asked (question slot) and the slot to be confirmed (confirmation slot). It is stored in the
[0024]
FIG. 1 is a configuration diagram illustrating a logical configuration of a voice interaction device 100 according to an embodiment of the present invention.
[0025]
The voice interaction device 100 mainly includes a
[0026]
The
[0027]
The meaning
[0028]
The
[0029]
The response
[0030]
The
[0031]
The
(A) Dictionary for speech recognition
It consists of a language dictionary for recognition, a sound dictionary for recognition, and the like.
(B) Word dictionary
It has categories, related categories, other attributes, pronunciation information, and the like.
(C) Slot value candidate word list
Candidate word list. A table consisting of pairs of words and their categories.
(D) Speech synthesis dictionary
It has pronunciation rules for speech synthesis regarding utterance inflection, word connection, spacing, and the like.
(E) Guidance sentence template (Fig. 3)
It consists of a plurality of guidance sentence templates with template numbers corresponding to pairs of confirmation slots and question slots.
[0032]
FIG. 4 is a flowchart illustrating a procedure of a process executed by the above-described voice interaction apparatus 100. In this procedure, first, an initial process is executed in
[0033]
In
[0034]
In an initial state, first, all target slots do not hold slot values, and thus there are no slots to be checked. First, since the shop name is asked, "shop name" is held in the "question slot", and 1 is set as the template number as an initial value. Accordingly, in the guidance generation unit, the guidance sentence template with the template number “1” whose “confirmation slot” is “empty” and the “question slot” is “store name” is selected. Here, the following guidance sentence is prepared. Example: Dialogue device: "Please say the name of the store."
[0035]
Next, in
[0036]
In
[0037]
In
[0038]
In
[0039]
In
[0040]
Hereinafter, the slot value, slot state, and guidance slot state of each target slot will be described in detail using specific examples.
[0041]
(1) The spoken dialogue apparatus asks a question about the “store name”, and the user responds to the question. Here, it is assumed that the speech recognition unit has correctly recognized.
Dialogue device: "Please say the name of the store."
User: "It's a dandelion."
Recognition result: "It is a dandelion."
As a result, “dandelion” is held in the “store name slot”, and the status of the slot and the “store name slot” is updated to “confirm”. In the guidance sentence slot, “store name” is set in “confirmation slot”, “address” is set in “question slot”, and “0” is set as the template number.
[0042]
(2) A “dandelion” is stored in the “store name slot”, and a guidance for asking an “address” is generated while confirming the result. In response, the user answers “address”. Here, it is assumed that erroneous recognition is performed and a valid recognition result is not obtained.
Dialogue device: "Please tell me the address of the dandelion."
User: "I'm Nagoya City."
Recognition result: "How many?"
Since a valid recognition result for “address slot” was not obtained, the slot value and the slot state are not updated, but the template number is updated. Therefore, a guidance sentence template is selected next, and a guidance sentence is generated.
[0043]
(3) Here, a guidance sentence having a different wording from the immediately preceding guidance sentence is generated. In response, the user answers “address”. Here, it is assumed that the speech recognition unit has correctly recognized.
Dialogue device: "Where is the dandelion?"
User: "I'm Nagoya City."
Recognition result: "Nagoya city."
“Nagoya City” is held in the “address slot”, and the slot state is updated to “confirmation”. The slot state of the “store name slot” is updated to “determined”, the template number is initialized, and “0” is set. For the guidance sentence slot, “address” is set to “confirmation slot”, “business type” is set to “question slot”, and “0” is set for the template number. Therefore, the guidance for asking the "business type" is generated while confirming the result of the "address slot" and the result.
[0044]
(4) The user answers "business type". Here, it is assumed that erroneous recognition is performed and a valid recognition result is not obtained.
Dialogue device: "What shop in Nagoya?"
User: "Restaurant."
Recognition result: "Yes, it is."
Since a valid recognition result for the “business type” slot was not obtained, the slot value and the slot state are not updated. In
[0045]
(5) The guidance for asking the "business type" is selected again, but the guidance sentence template of "2" is selected. In response, the user answers "business type".
Dialogue device: "What kind of business is in Nagoya?"
User: "Restaurant."
Recognition result: "It is a restaurant"
“Restaurant” is held in the “industry” slot, and the slot status is updated to “confirm”. Further, "Nagoya City" is updated to a "fixed" state. For the template number, an initial value “0” is set. In
[0046]
(6) Finally, confirmation is made for the “industry slot”. In response, the user answers "yes" and the dialog ends.
Dialogue device: "Are you a restaurant?"
User: "Yes"
Recognition result: "Yes"
[0047]
The guidance sentence output in
Dialogue device: "Now, set a dandelion at a restaurant in Nagoya City."
Thus, by implementing the above-described invention, the above-described voice interactive device can be realized.
[0048]
As a result, even when the same content is repeatedly provided, it is possible to prompt the user to answer with a guidance sentence having a different expression without performing the same guidance, and without causing discomfort to the user. It is possible to expect a smoother conversation with the voice interaction device.
[0049]
In the above-described embodiment, an example has been described in which three slots of “store name”, “address”, and “business type” are determined. However, at least one other slot may be determined. Further, as other slots are determined, a suitable guidance sentence template may be prepared.
[0050]
Since the guidance sentence template in the above embodiment is one example, other guidance sentence templates may be prepared.
[0051]
Further, a combination of “question slot” and “confirmation slot” of the guidance sentence template may be prepared in addition to the above. A guidance sentence template for “question slot” and “confirmation slot” alone may be prepared.
[0052]
Furthermore, in the above embodiment, the implicit confirmation was performed by putting the immediately preceding recognition result into the next guidance sentence. However, depending on the contents of the intended answer, the question and confirmation may be performed for each slot. Dialogue control may be performed. In this case, the prepared guidance sentence template prepares a plurality of question guidances and confirmation guidances for each target slot. Further, any other necessary guidance may be provided.
[0053]
Furthermore, in the above-described embodiment, an example is shown in which control is performed for implicitly confirming one slot for which an answer was obtained immediately before and for determining an answer for the next one slot. The number of slots for which an answer is required is not limited to one. If necessary, each may be singular or plural. Further, the control may be a control for requesting confirmation only for at least one slot, or a control for requesting only an answer for at least one slot.
[0054]
Further, in the above embodiment, the guidance sentence also shows one example for each of the slot for asking for confirmation and the slot for asking for an answer. Further, any guidance sentence corresponding to the control of the question slot may be used. Therefore, guidance sentences corresponding to at least one slot for each of a question and a confirmation may be prepared as needed.
[0055]
Furthermore, a plurality of confirmation sentence slots and question slots may be prepared as needed.
[0056]
The above-described embodiment is an example of the present invention, and the present invention is not limited to the embodiment. Various modifications can be considered in light of the essence of the present invention.
[Brief description of the drawings]
FIG. 1 is a configuration diagram illustrating a logical configuration of a voice interaction device according to an embodiment of the present invention.
FIG. 2 is an explanatory diagram of a slot table used by a
FIG. 3 is an explanatory diagram of a guidance sentence template used by a
FIG. 4 is a flowchart illustrating a procedure of a process executed by the voice interaction device 100;
[Explanation of symbols]
100… voice interaction device
110 ... voice input unit
120… voice recognition unit
130… semantic understanding
131… word extraction unit
132… word judgment unit
140… Dialogue control unit
141… answer sentence re-request section
150 ... Guidance generation unit
160 ... audio output unit
170… Database
171: Guidance storage unit
Claims (6)
前記回答文から、前記ガイダンス文が目的とした回答が得られたか否かを判断する判断手段と、
前記判断手段により目的の回答が得られなかったと判断された場合には、その目的とする回答を得るための他の異なるガイダンス文を音声出力して、発話者に再度、回答文を要求する回答文再要求手段と
を有することを特徴とする音声対話装置。A voice recognition device that outputs a guidance sentence to obtain a desired answer from a speaker, analyzes a response sentence obtained from the speaker in response to the guidance sentence, and determines a desired answer.
From the answer sentence, a determining means for determining whether or not the answer intended by the guidance sentence has been obtained,
If it is determined by the determining means that the target answer was not obtained, another different guidance sentence for obtaining the target answer is output by voice, and the answer requesting the speaker again for the answer sentence A spoken dialogue apparatus comprising: a sentence re-requesting unit.
前記ガイダンス文に応答して発話者から得られる回答文を解析し、前記回答文から、前記ガイダンス文が目的とした回答が得られたか否かを判断する判断手順と、
前記判断手順により目的の回答が得られなかったと判断された場合には、その目的とする回答を得るための他の異なるガイダンス文を生成しガイダンス文を音声出力し発話者に再度、回答文を要求する回答文再要求手順と
をコンピュータに実行させる音声対話プログラム。Outputting a guidance sentence to obtain a desired answer from the speaker;
Analyzing the answer sentence obtained from the speaker in response to the guidance sentence, from the answer sentence, a determination procedure to determine whether the intended answer of the guidance sentence has been obtained,
When it is determined that the target answer is not obtained by the above-described determination procedure, another different guidance sentence for obtaining the target answer is generated, the guidance sentence is output as a voice, and the answer is again sent to the speaker. A spoken dialogue program that causes a computer to execute a requested answer sentence re-request procedure.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002177301A JP2004021028A (en) | 2002-06-18 | 2002-06-18 | Voice interaction device and voice interaction program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002177301A JP2004021028A (en) | 2002-06-18 | 2002-06-18 | Voice interaction device and voice interaction program |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2004021028A true JP2004021028A (en) | 2004-01-22 |
Family
ID=31175374
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002177301A Pending JP2004021028A (en) | 2002-06-18 | 2002-06-18 | Voice interaction device and voice interaction program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2004021028A (en) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008180801A (en) * | 2007-01-23 | 2008-08-07 | Kyushu Institute Of Technology | Automatic answering apparatus and method |
| KR20140111538A (en) * | 2013-03-11 | 2014-09-19 | 삼성전자주식회사 | Interactive sever, display apparatus and control method thereof |
| JP2016085747A (en) * | 2015-11-24 | 2016-05-19 | 株式会社東芝 | Interactive device |
| CN111341311A (en) * | 2020-02-21 | 2020-06-26 | 深圳前海微众银行股份有限公司 | A kind of voice dialogue method and device |
| CN115579008A (en) * | 2022-12-05 | 2023-01-06 | 广州小鹏汽车科技有限公司 | Voice interaction method, server and computer readable storage medium |
-
2002
- 2002-06-18 JP JP2002177301A patent/JP2004021028A/en active Pending
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008180801A (en) * | 2007-01-23 | 2008-08-07 | Kyushu Institute Of Technology | Automatic answering apparatus and method |
| KR20140111538A (en) * | 2013-03-11 | 2014-09-19 | 삼성전자주식회사 | Interactive sever, display apparatus and control method thereof |
| KR102084739B1 (en) * | 2013-03-11 | 2020-04-14 | 삼성전자주식회사 | Interactive sever, display apparatus and control method thereof |
| JP2016085747A (en) * | 2015-11-24 | 2016-05-19 | 株式会社東芝 | Interactive device |
| CN111341311A (en) * | 2020-02-21 | 2020-06-26 | 深圳前海微众银行股份有限公司 | A kind of voice dialogue method and device |
| CN115579008A (en) * | 2022-12-05 | 2023-01-06 | 广州小鹏汽车科技有限公司 | Voice interaction method, server and computer readable storage medium |
| CN115579008B (en) * | 2022-12-05 | 2023-03-31 | 广州小鹏汽车科技有限公司 | Voice interaction method, server and computer readable storage medium |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| AU2022221524B2 (en) | Tailoring an interactive dialog application based on creator provided content | |
| CN118538199B (en) | Determining a language for speech recognition of a spoken utterance received via an automatic assistant interface | |
| US7974835B2 (en) | Method, system, and apparatus for natural language mixed-initiative dialogue processing | |
| KR102429407B1 (en) | User-configured and customized interactive dialog application | |
| JP2017058673A (en) | Dialog processing apparatus and method and intelligent dialog processing system | |
| CN118865957A (en) | On-device speech synthesis of text snippets for training on-device speech recognition models | |
| JP2021022928A (en) | Artificial intelligence-based automatic response method and system | |
| CN111489752B (en) | Speech output method, device, electronic equipment and computer-readable storage medium | |
| JP2024170506A (en) | Instant text-to-speech learning during dialogue | |
| JP2005196134A (en) | Spoken dialogue system and method, and spoken dialogue program | |
| JP2010160608A (en) | Interaction device, interaction program, and interaction method | |
| JP2004045900A (en) | Voice interaction device and program | |
| JP2004021028A (en) | Voice interaction device and voice interaction program | |
| JP2010197858A (en) | Speech interactive system | |
| JP4220151B2 (en) | Spoken dialogue device | |
| JP2003228393A (en) | Spoken dialogue apparatus and method, spoken dialogue program and recording medium therefor | |
| Thymé-Gobbel et al. | Conveying Reassurance with Confidence and Confirmation |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050209 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070410 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070424 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070821 |