JP2016110151A - 音声管理サーバー装置、会話音声提供方法、会話音声提供システム - Google Patents
音声管理サーバー装置、会話音声提供方法、会話音声提供システム Download PDFInfo
- Publication number
- JP2016110151A JP2016110151A JP2015238101A JP2015238101A JP2016110151A JP 2016110151 A JP2016110151 A JP 2016110151A JP 2015238101 A JP2015238101 A JP 2015238101A JP 2015238101 A JP2015238101 A JP 2015238101A JP 2016110151 A JP2016110151 A JP 2016110151A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- user
- server device
- talk
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000004044 response Effects 0.000 claims abstract description 85
- 241000282414 Homo sapiens Species 0.000 claims abstract description 34
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 15
- 230000015572 biosynthetic process Effects 0.000 claims description 35
- 238000003786 synthesis reaction Methods 0.000 claims description 35
- 230000010365 information processing Effects 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 10
- 241001465754 Metazoa Species 0.000 description 19
- 230000008451 emotion Effects 0.000 description 13
- 238000005070 sampling Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 3
- 206010037180 Psychiatric symptoms Diseases 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000013065 commercial product Substances 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 206010011224 Cough Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
Landscapes
- Telephonic Communication Services (AREA)
Abstract
Description
複数の音声合成用データは、それぞれ異なるヒトの音声に由来する音声素片データで構成され、当該ヒトの音声を合成する際に用いられる。
「音声素片データ」とは、例えば、ヒトの音声を構成する短い区間のデータ(五十音、濁音、半濁音などの発音一つ一つの音のデータ)である。例えば、五十音、濁音、半濁音などの発音一つ一つ(音声素片)をつなぎ合わせることで、音声(当該音声素片を発した本人の声)を合成することができる。
前記複数の動物の音声のうち、ユーザが選択した任意の音声を指定する音声利用リクエストをインターネットを通じて受け付ける受信手段と、
前記ユーザに対する応答メッセージをユーザが選択した前記音声により出力するための音声応答データを、前記音声合成用データ(音声素片データ)を利用して生成(合成)する情報処理手段と、
を更に有する
前記音声応答データを、ユーザが選択した任意の端末に対して、インターネットを通じて送信するための送信手段を、更に有する。
前記音声合成用データ(音声素片データ)の利用頻度を示す利用データを記録する利用情報記録手段を更に具備し、前記情報処理手段は、前記ユーザからの音声利用リクエストに応じて、前記利用情報記録手段の利用データを更新する。
(a) ユーザのトーク音声をユーザ端末からサーバー装置へ自動送信するステップと、
(b) ユーザ端末から受信したトーク音声の内容をサーバー装置に記録するステップと、
(c) 受信したトーク内容に応答する応答メッセージを、サーバー装置の人工知能(Artificial Intelligence)により生成するステップと、
(d) ユーザが予め選択した音声で前記応答メッセージを出力するための音声応答データを、前記音声合成用データ(音声素片データ)を利用して、サーバー装置の人工知能により生成するステップと、
(e) 前記音声応答データを、ユーザ側の会話端末へ送信するステップと、
を含む会話音声提供方法によって達成される。
前記複数の動物の音声うち、ユーザが選択した任意の音声を指定する音声利用リクエストをユーザ端末から受信するステップを更に含んでいる。
ユーザ端末から受信したユーザのトーク音声から、ユーザの感情を解析するステップと、解析した感情に関するデータをトーク内容に関連付けした状態で記録するステップと、を更に含んでおり、
前記ステップ(c)において、記録されたユーザのトーク音声の内容とそれに対応するユーザの感情とを踏まえた応答内容になるように、受信したトーク内容に応答する応答メッセージを生成する。
一定の期間内における前記音声の利用頻度を示す利用頻度データを生成し、該音声の識別情報に関連付けた状態で記録する。
前記ユーザ端末は、ユーザが居住または滞在する空間に設置されている。
前記ユーザ端末は、家庭用電気機械器具、家具、玩具のいずれかに取り付けられている。
複数の動物(ヒトを含む)の音声の各々について作成された複数の音声合成用データであって、該音声を合成するための複数の音声合成用データが記録された音声管理サーバー装置と、ユーザのトーク音声をユーザ端末からサーバー装置へ送信するとともに、該トーク音声に対する応答音声をサーバー装置から受信するユーザ端末と、を含んで構成される会話音声提供システムであって、
前記音声管理サーバー装置は、
ユーザ端末から受信したユーザのトーク音声の内容をサーバー装置に記録する手段と、
受信したトーク内容に応答する応答メッセージを、サーバー装置の人工知能(Artificial Intelligence)により生成する手段と、
ユーザが予め選択した音声で前記応答メッセージを出力するための音声応答データを作成する手段と、
前記音声応答データを、ユーザ側の会話端末へ送信する手段と、を含んでおり、
前記ユーザ端末は、
ユーザのトーク音声をユーザ端末からサーバー装置へ送信する手段と、
前記トーク音声に応答する音声応答データをサーバー装置から受信する手段と、を含む
ことを特徴とする会話音声提供システムによって達成される。
はじめに、本発明の音声管理サーバー装置の実施形態の一例について説明する。
人工知能などの各種プログラムがインストールされたプログラム格納部と、
後述する各種情報を記録するためのデータベースと、
応答メッセージの生成や音声の合成の際に用いられるCPU(情報処理手段/Central Processing Unit)と、
各種情報処理の際などに用いられるメモリと、
インターネットを通じてユーザ側の端末を情報の送受信を行うための通信装置と、
を具備している。
会話用ユーザ側の端末から受信したトーク音声の内応を示す情報と、
その端末のユーザの識別情報(ユーザID)と、
そのトーク音声を受信した日時の情報と、
そのトーク音声から解析して得られたユーザの感情情報と、
そのトーク音声の内容を解析して得られたトーク重要度に関する情報と、
が関連付けした状態で(紐付けした状態で)記録されている。
複数の動物の音声のうち、ユーザが選択した任意の音声を指定する音声利用リクエストをインターネットを通じて受け付ける受信手段と、
前記音声応答データを、ユーザが選択した任意の端末に対して、インターネットを通じて送信するための送信手段と、
を含んで構成されている。
次に、本発明の会話音声提供システムの実施形態の一例について説明する。
複数の動物(ヒトを含む)の音声の各々について作成された複数の音声合成用データであって、該音声を合成するための複数の音声合成用データが記録された「音声管理サーバー装置」と、
ユーザのトーク音声をユーザ端末からサーバー装置へ送信するとともに、該トーク音声に対する応答音声をサーバー装置から受信する「会話用ユーザ端末」と、
を含んで構成される。
主として図7に基づいて説明する。
主として図8に基づいて説明する。
主として図9に基づいて説明する。
主として図10に基づいて説明する。
また例えば、2011年1月28日6時10分のトーク内容「今日はAKBのコンサートに行ってくるよ」に対しては、前日23時50分のトーク内容「明日は雨か」を参照し、そのトーク内容を踏まえて「おはよう。今日も頑張ってね。今日は雨だから傘を忘れないでね。」といった応答メッセージを生成する。
主として図11に基づいて説明する。
次に、本発明で用いる音声合成用データ(音声素片データ)を集める方法、すなわち、音声採取方法の実施形態について説明する。
音声提供者の音声を入力できるように構成された音声提供者用端末(音声登録用端末)から、インターネットを介して、音声素片データの収集に用いるサーバー装置へアクセスし、
前記音声提供者用端末(音声登録用端末)に接続された音声入力手段を介して、音声提供者の音声をサンプリングし、
サンプリングした前記音声に関する音声サンプリングデータを、音声提供者用端末からサーバー装置へ送信し、
前記サーバー装置において、前記音声サンプリングデータに基づいて音声素片データを生成し、
前記音声提供者に関する提供者識別情報と前記音声素片データとを関連付けした状態で、前記サーバー装置の情報記録手段に保存する、
というものである。
また、「音声入力手段」とは、例えば、コンピュータに接続されたマイクや、携帯型情報端末が内蔵するマイクなどが挙げられる。
また、「音声素片データ」とは、例えば、ヒト音声を構成する短い区間のデータ(五十音、濁音、半濁音などの発音一つ一つの音のデータ)である。例えば、五十音、濁音、半濁音などの発音一つ一つ(音声素片)をつなぎ合わせることで、音声(当該音声素片を発した本人の声)を合成することができる。
音声採取方法の第2実施形態の概要は、
音声提供者の音声を入力できるように構成された音声提供者用端末から、インターネットを介して、音声素片データの収集に用いるサーバー装置へアクセスし、
前記音声提供者用端末に接続された音声入力手段を介して、音声提供者の音声をサンプリングし、
前記音声提供者用端末において、サンプリングした前記音声に関する音声サンプリングデータに基づいて、音声素片データを生成し、
生成した前記音声素片データを音声提供者用端末からサーバー装置へ送信し、
前記音声提供者に関する提供者識別情報と前記音声素片データとを関連付けした状態で、前記サーバー装置の情報記録手段に保存する、
というものである。
Claims (8)
- 異なる複数のヒトの音声の各々について作成された複数の音声合成用データであって、当該複数のヒトの音声を合成するための複数の音声合成用データが記録された音声情報記録手段を有する音声管理サーバー装置。
- 前記複数の音声合成用データは、それぞれ、
ヒトの音声に由来する音声素片データで構成され、
当該ヒトの音声を合成する際に用いられる、
ことを特徴とする請求項1に記載の音声管理サーバー装置。 - 前記複数のヒトの音声のうち、ユーザが選択した任意の音声を指定する音声利用リクエストをインターネットを通じて受け付ける受信手段と、
前記ユーザに対する応答メッセージをユーザが選択した前記音声により出力するための音声応答データを、前記音声合成用データを利用して生成する情報処理手段と、
を有する請求項1に記載の音声管理サーバー装置。 - 前記音声応答データを、ユーザが選択した任意の端末に対して、インターネットを通じて送信するための送信手段を、更に有することを特徴とする請求項3に記載の音声管理サーバー装置。
- 異なる複数のヒトの音声の各々について作成された複数の音声合成用データであって、当該複数のヒトの音声を合成するための複数の音声合成用データが記録された音声管理サーバー装置と、該サーバー装置との間で送受信可能なユーザ端末と、を用いた会話音声提供方法であって、
(a) ユーザのトーク音声をユーザ端末からサーバー装置へ自動送信するステップと、
(b) ユーザ端末から受信したトーク音声の内容をサーバー装置に記録するステップと、
(c) 受信したトーク内容に応答する応答メッセージを、サーバー装置により生成するステップと、
(d) ユーザが予め選択した音声で前記応答メッセージを出力するための音声応答データを、前記音声合成用データを利用して、サーバー装置により生成するステップと、
(e) 前記音声応答データを、サーバー装置からユーザ端末へ送信するステップと、
を含む会話音声提供方法。 - 前記ステップ(c)において、サーバー装置に記録されたユーザの現在及び/又は過去のトーク内容を踏まえた応答内容になるように、受信したトーク内容に応答する応答メッセージを生成する、
ことを特徴とする請求項5に記載の会話音声提供方法。 - 前記複数のヒトの音声うち、ユーザが選択した任意の音声を指定する音声利用リクエストをユーザ端末から受信するステップを更に含んでいる、
ことを特徴とする請求項5に記載の会話音声提供方法。 - 異なる複数のヒトの音声の各々について作成された複数の音声合成用データであって、当該複数のヒトの音声を合成するための複数の音声合成用データが記録された音声管理サーバー装置と、ユーザのトーク音声をユーザ端末からサーバー装置へ送信するとともに、該トーク音声に対する応答音声をサーバー装置から受信するユーザ端末と、を含んで構成される会話音声提供システムであって、
前記音声管理サーバー装置は、
ユーザ端末から受信したユーザのトーク音声の内容をサーバー装置に記録する手段と、
受信したトーク内容に応答する応答メッセージを生成する手段と、
ユーザが予め選択した音声で前記応答メッセージを出力するための音声応答データを作成する手段と、
前記音声応答データをユーザ端末へ送信する手段と、を含んでおり、
前記ユーザ端末は、
ユーザのトーク音声をユーザ端末からサーバー装置へ送信する手段と、
前記トーク音声に応答する音声応答データをサーバー装置から受信する手段と、
を含むことを特徴とする会話音声提供システム。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2014246286 | 2014-12-04 | ||
| JP2014246286 | 2014-12-04 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2016110151A true JP2016110151A (ja) | 2016-06-20 |
| JP6598369B2 JP6598369B2 (ja) | 2019-10-30 |
Family
ID=56122197
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015238101A Ceased JP6598369B2 (ja) | 2014-12-04 | 2015-12-04 | 音声管理サーバー装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6598369B2 (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018014091A (ja) * | 2017-06-20 | 2018-01-25 | Gatebox株式会社 | 画像表示装置、話題選択方法、話題選択プログラム |
| JP2019124855A (ja) * | 2018-01-18 | 2019-07-25 | 株式会社ユピテル | 装置及びプログラム等 |
| CN110941329A (zh) * | 2018-09-25 | 2020-03-31 | 未来市股份有限公司 | 人工智能系统及互动响应方法 |
| WO2024241746A1 (ja) * | 2023-05-25 | 2024-11-28 | 三井化学株式会社 | 音声会話生成装置、音声会話システム、音声会話生成装置の制御方法及び制御プログラム |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11259271A (ja) * | 1998-03-13 | 1999-09-24 | Aqueous Reserch:Kk | エージェント装置 |
| JP2003169147A (ja) * | 2001-11-30 | 2003-06-13 | Buzzhits Kk | 顧客応答システム及び方法 |
| JP2003216186A (ja) * | 2002-01-21 | 2003-07-30 | Arcadia:Kk | 音声データ配信管理システムおよびその方法 |
| JP2007163875A (ja) * | 2005-12-14 | 2007-06-28 | Advanced Telecommunication Research Institute International | 音声合成装置および音声合成プログラム |
| JP2014021136A (ja) * | 2012-07-12 | 2014-02-03 | Yahoo Japan Corp | 音声合成システム |
| WO2014181524A1 (ja) * | 2013-05-09 | 2014-11-13 | ソフトバンクモバイル株式会社 | 会話処理システム及びプログラム |
-
2015
- 2015-12-04 JP JP2015238101A patent/JP6598369B2/ja not_active Ceased
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11259271A (ja) * | 1998-03-13 | 1999-09-24 | Aqueous Reserch:Kk | エージェント装置 |
| JP2003169147A (ja) * | 2001-11-30 | 2003-06-13 | Buzzhits Kk | 顧客応答システム及び方法 |
| JP2003216186A (ja) * | 2002-01-21 | 2003-07-30 | Arcadia:Kk | 音声データ配信管理システムおよびその方法 |
| JP2007163875A (ja) * | 2005-12-14 | 2007-06-28 | Advanced Telecommunication Research Institute International | 音声合成装置および音声合成プログラム |
| JP2014021136A (ja) * | 2012-07-12 | 2014-02-03 | Yahoo Japan Corp | 音声合成システム |
| WO2014181524A1 (ja) * | 2013-05-09 | 2014-11-13 | ソフトバンクモバイル株式会社 | 会話処理システム及びプログラム |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018014091A (ja) * | 2017-06-20 | 2018-01-25 | Gatebox株式会社 | 画像表示装置、話題選択方法、話題選択プログラム |
| JP2019124855A (ja) * | 2018-01-18 | 2019-07-25 | 株式会社ユピテル | 装置及びプログラム等 |
| JP7130201B2 (ja) | 2018-01-18 | 2022-09-05 | 株式会社ユピテル | 装置及びプログラム等 |
| CN110941329A (zh) * | 2018-09-25 | 2020-03-31 | 未来市股份有限公司 | 人工智能系统及互动响应方法 |
| WO2024241746A1 (ja) * | 2023-05-25 | 2024-11-28 | 三井化学株式会社 | 音声会話生成装置、音声会話システム、音声会話生成装置の制御方法及び制御プログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP6598369B2 (ja) | 2019-10-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20220284896A1 (en) | Electronic personal interactive device | |
| US9691018B2 (en) | Interface apparatus and method for providing interaction of a user with network entities | |
| CN109272984A (zh) | 用于语音交互的方法和装置 | |
| JP2020034895A (ja) | 応答方法及び装置 | |
| CN109346076A (zh) | 语音交互、语音处理方法、装置和系统 | |
| JP7619390B2 (ja) | 会話出力システム及び会話出力方法 | |
| JP6598369B2 (ja) | 音声管理サーバー装置 | |
| CN109377979B (zh) | 更新欢迎语的方法和系统 | |
| JP2015176058A (ja) | 電子機器、方法及びプログラム | |
| WO2019214456A1 (zh) | 一种肢体语言翻译系统、方法及服务器 | |
| CN114817514B (zh) | 回复音频的确定方法及装置、存储介质及电子装置 | |
| CN112634886B (zh) | 一种智能设备的交互方法、服务器、计算设备及存储介质 | |
| JP2021149664A (ja) | 出力装置、出力方法及び出力プログラム | |
| JPWO2018030149A1 (ja) | 情報処理装置及び情報処理方法 | |
| JP2014098844A (ja) | 対話支援装置、対話システム、対話支援方法及びプログラム | |
| JP2017117090A (ja) | 対話システムおよびプログラム | |
| WO2016052520A1 (ja) | 対話装置 | |
| JP4568211B2 (ja) | 感覚通信装置及び感覚通信方法 | |
| CN112672207A (zh) | 音频数据处理方法、装置、计算机设备及存储介质 | |
| JP7331349B2 (ja) | 会話出力システム、サーバ、会話出力方法及びプログラム | |
| JP2014109998A (ja) | 対話装置及びコンピュータ対話方法 | |
| JP2015173857A (ja) | 電子機器及び情報処理方法 | |
| US20250349294A1 (en) | Voice assistance system and method for holding a conversation with a person | |
| KR20200085433A (ko) | 탈부착형 스피커를 포함한 음성합성 시스템 및 방법 | |
| US20250345714A1 (en) | Interactive ai toy capable of holding a conversation with a person, and method of interacting with same |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| AA64 | Notification of invalidation of claim of internal priority (with term) |
Free format text: JAPANESE INTERMEDIATE CODE: A241764 Effective date: 20160107 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160201 |
|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20171110 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171114 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20171114 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180206 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181025 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181206 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190204 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190327 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190730 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190930 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6598369 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| RVOP | Cancellation by post-grant opposition |