JP3728921B2 - 音声指令端末装置 - Google Patents
音声指令端末装置 Download PDFInfo
- Publication number
- JP3728921B2 JP3728921B2 JP10504698A JP10504698A JP3728921B2 JP 3728921 B2 JP3728921 B2 JP 3728921B2 JP 10504698 A JP10504698 A JP 10504698A JP 10504698 A JP10504698 A JP 10504698A JP 3728921 B2 JP3728921 B2 JP 3728921B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- command
- voice recognition
- terminal device
- vending machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Selective Calling Equipment (AREA)
- Lock And Its Accessories (AREA)
Description
【発明の属する技術分野】
本発明は例えば音声認識カードなどの音声指令端末装置に関する。
【0002】
【従来の技術】
近年、音声認識の技術が実用化されつつある。音声認識技術には不特定話者を対象にしたものと特定話者を対象にしたものとの2種類ある。例えば、音声認識機能を有する公共の施設などの前で、不特定話者がある名前を発音すると、この名前が認識されて対応する処理を実行するものが知られている。
【0003】
これに対して、特定話者を対象にしたものは、特定の人間の音声を登録しておき、登録した人間のみを対象に音声認識を行って認識された音声に対応する処理を実行するものである。
【0004】
【発明が解決しようとする課題】
しかしながら、上記した不特定話者を対象にした従来の音声認識装置は、不特定多数のユーザを対象としているので認識可能な語彙数が限られていたり、語彙数を増やそうとすると認識率が良好でなく実用の域までには到達していない。また、上記した特定話者を対象にした音声認識装置においては、認識率は高いが限られた特定の人間の間でしか使用することができないという問題がある。
【0005】
さらに、音声認識を行なう場所が固定されていたので周囲の雑音などに影響されたり、他人が存在し得る環境で発音する必要があるので秘匿性を保持する必要がある場合には適していないという問題があった。
【0006】
本発明の課題は、認識率の高い特定話者による音声認識機能を各ユーザが所持する端末に持たせてユーザが所望の場所で音声入力を行なえるようにすることで、秘匿性を保ちつつ不特定多数の音声を極めて高い認識率で認識できるようにすることである。
【0007】
【課題を解決するための手段】
本発明の音声指令端末装置は、入力された音声を認識する音声認識手段と、この音声認識手段により認識された音声に対応する指令情報を音声とは異なる形態で他装置の機種別に登録する登録手段と、前記指令情報を受信して対応する処理を実行する他装置への接近を示す情報を当該他装置から取得したときに、前記登録手段に登録された当該他装置の指令情報を当該他装置に送信する送信手段とを具備することを特徴とする。
【0010】
【発明の実施の形態】
以下、図面を参照して本発明の一実施形態を詳細に説明する。図1は、本発明の音声指令端末装置を適用した音声認識カードの構成を示す図であり、図中の参照番号10は当該音声認識カード全体を制御する制御部としてのCPUである。11は音声入力部としてのマイクであり、12はキーボードであり、音声指令キーや送信キーを含む種々の指令を入力するためのキーを備えている。13はユーザにより入力された音声に対応する指令情報を自動販売機などの他の装置に送信するときの送信手段としての通信インタフェースであり、14はユーザが選択可能な複数種類の対象機種を示すメニューを表示するための表示部14であり、15はユーザにより入力された音声を認識する音声認識部(音声認識手段)であり、16は話者登録辞書として用いられるフラッシュROMであり、17は入力された音声からCPU10による検索により指令データを得るのに用いられる指令テーブルである。
【0011】
図2は図1に示す指令テーブルの構成を示す図であり、ユーザが選択可能な複数の機種コードと、各機種において使用される指令データ(指令情報)と、各指令データに対応する音声データとが対応付けて記憶されている。図2では、例えば切符販売用の自動販売機Aの機種コードに対して3つの指令データと音声データとが例として示されている。
【0012】
図3は表示部14に表示されるメニューの一例を示す図であり、ユーザが選択可能な機種として、1.自動販売機A、2.自動販売機B、3.ドアA、4.ドアB、5.TVが例として示されている。
【0013】
以下に、音声認識カードに対する音声登録処理の詳細を図4に示すフローチャートを参照して説明する。
まず、音声指令キーを押すと、図3に示すような対象機種の候補が表示部14に表示される(ステップS1)。ユーザはこのメニューを見て、例えば、切符購入用の自動販売機Aを選択した後(ステップS2)、マイク11を介して例えば、“東京”、“大阪”などの行き先を音声で入力する(ステップS3)。すると音声認識部15において入力された音声の認識が行われる(ステップS4)。次に、指令テーブル17内を走査して認識された音声データに対応する指令データを検索して(ステップS5)、検索された対応指令データを、選択した機種(ここでは自動販売機A)の機種コードと共にテキストデータの形でフラッシュROM16に記憶する(ステップS6)。次に、登録すべき音声データが他にあるか否かを判断し(ステップS7)、他にある場合にはステップS3に戻って音声の入力を行なう。例えば、ユーザは、実行してほしい指令に対応する音声データを複数、対象機種ごとにあらかじめまとめて(例えば1日分)入力しておくことが可能である。これによって選択した機種に応じて音声データに対応する指令データを選択することができる。
【0014】
また、音声データと、この音声データを変換した形態の音声データ(例えば、“パソコン”を“パーソナルコンピュータ”に変換する)とを対応付けてフラッシュROM16に登録しておき、“パソコン”という音声が入力されたときに“パーソナルコンピュータ”が登録されるようにしてもよい。
【0015】
図5は上記の方法で登録した指令データを送信するときの処理の詳細を示すフローチャートである。まず、図7に示すように、ユーザ99が音声認識カード100を、切符購入用の自動販売機101に例えば3m以内にまで近づけることにより自動販売機101から機種接近情報を受信するか、あるいはユーザ99が送信キーを押したか否かを判定し(ステップS8、S9)、いずれかの判定がYESになった場合には、音声認識カード100はあらかじめ登録されている音声データに対応する指令データと機種コードとを自動販売機に赤外線などの非接触手段により送信する(ステップS10)。当該指令データが自動販売機101によって正常に認識されたときには応答発信が音声認識カード99側に返されるのでステップS11がYESとなって、送信すべき指令データが他に有るか否かを判断する(ステップS12)。ここでNOの場合は処理を終了するが、YESの場合にはステップS8に戻って機種接近情報があるか(ステップS8)あるいは送信キーが押されたか否か(ステップS9)の判定を行なう。一方、当該指令データが正常に認識されなかった場合には応答発信が無いのでエラー表示を行なう(ステップS13)。
【0016】
次に、図6のフローチャートを参照して自動販売機101によるコマンド受信処理の詳細を説明する。自動販売機101は機種接近情報を常に発信しており(ステップS20)、これが音声認識カード100により認識されると、音声認識カード100側から指令データと機種コードとが送信されてくるので、その機種コードが自身の機種コードと一致する指令データを受信したか否かを判定する(ステップS21)。機種コードが一致する指令データを受信したときには、この指令データを解析して(ステップS22)、指令データに対応する物品(切符)をユーザ99に提供することが可能かどうかを判定する(ステップS23)。ここでユーザが所定額の金銭を投入し、かつ、販売可能な行き先であった場合にはYESとなり、次に、音声認識カード100に対して応答発信を行ない(ステップS24)、続いて当該物品(切符)をユーザ99に提供する対応処理(ステップS25)を行なった後、ステップS20に戻る。また、ステップS23においてNOの場合にはエラー表示(ステップS26)を行ってステップS20に戻る。
【0017】
上記した実施形態によれば、ユーザは、音声認識カードの携帯性を利用して、他人の介在しない所望の場所であらかじめ音声登録を行ない、その後、自動販売機の設置してある場所に音声認識カードを運んで指令データを送信することができる。この場合の音声認識方法は、音声認識カードを所持するユーザのみの特定話者を対象としたものになるので、秘匿性を保ちつつ不特定多数の音声を極めて高い認識率で認識できる。これによって、切符の販売機の場合には、料金表を見なくともかつキー操作を行なうことなしに切符を購入する作業、及び視力の弱い人や、機械走査に不慣れな人が助けを必要とせずに切符を購入する作業が簡単かつ確実に行なえるようになる。
【0018】
なお、コマンドの送信方法は非接触手段として赤外線の他に、光や電磁結合による方法を用いてもよい。また、自動販売機に専用のカードリーダを設けて電気的接触による方法を用いてもよい。また、切符購入用の自動販売機に限らず、飲料購入用など他の任意の自動販売機であってもよい。
【0019】
以下に上記した音声認識カードをオートドアロックに適用した変形例を図8を参照して説明する。
まず、ユーザ199は、所望の場所で音声認識カード200に所定の暗証番号を予め登録する。例えば、「すずきいちろう」と入力すると、暗証番号「54184973」に変換されて登録される。音声の登録方法は上記した方法に準じて行なうことができる。
【0020】
次に、ユーザ199は、ドアロックを通って入室/入館する場合、音声認識カード200に「すずきいちろう」と話す。
次に、音声認識カード200をオートロック装置201に近づける。受信範囲内に入れば、暗証番号「54184973」がオートロック装置201に入力される。
【0021】
次に、オートロック装置201はこの暗号番号を認識することにより、ドアロックが解除されてドア202からの入室/入館が可能になる。
上記した変形例によれば、秘匿性を保ちつつ不特定多数の音声を極めて高い認識率で認識できるようになる。また、長い暗証番号を覚える必要がなくなるので、入室/入館動作が簡略化される。また、オートロック装置などのキー操作が不要になり、利便性が大幅に向上するとともに、身体障害者やお年寄りなどにも使用できる。また、特定話者認識なので正当な使用者以外のものが音声認識カードを取得して、「すずきいちろう」と話しても認識できないため不正な入室/入館ができないので、電子ロックとしての安全性が格段に向上する。
【0022】
さらなる変形例として、音声認識カードに辞書機能を持たせることで、家電製品のリモコンや電話帳などにも利用できる。例えば、テレビリモコンなどで、「わうわう」を音声入力し、これを「BS5」に変換した上でテレビに送信したり、電話帳において、「たまくやくしょ」を音声入力し、これを「0449353111」に変換した上で電話機に送信することも可能である。
【0023】
【発明の効果】
本発明によれば、認識率の高い特定話者による音声認識機能を各ユーザが所持する端末装置に持たせ、この端末装置を他装置へ接近することによって、接近した当該他装置に対応して登録されている指令情報を当該他装置に送信することができ、他装置に対応して的確に指令情報を送信して他装置による処理を実行させることができる。
【図面の簡単な説明】
【図1】本発明の音声指令端末装置が適用される音声認識カードの構成を示す図である。
【図2】音声認識カードの指令テーブルの構成を示す図である。
【図3】音声認識カードの表示部に表示されるメニューの一例を示す図である。
【図4】音声認識カードに対する音声登録処理の詳細を説明するためのフローチャートである。
【図5】登録した指令データを送信するときの処理の詳細を示すフローチャートである。
【図6】自動販売機によるコマンド受信処理の詳細を説明するためのフローチャートである。
【図7】音声認識カードを自動販売機に適用したときの作用を説明するための図である。
【図8】音声認識カードをオートロック装置に適用したときの作用を説明するための図である。
【符号の説明】
10…CPU、
11…マイク、
12…キーボード、
13…通信インタフェース、
14…表示部、
15…音声認識部、
16…フラッシュROM、
17…指令テーブル。
Claims (2)
- 入力された音声を認識する音声認識手段と、
この音声認識手段により認識された音声に対応する指令情報を音声とは異なる形態で他装置の機種別に登録する登録手段と、
前記指令情報を受信して対応する処理を実行する他装置への接近を示す情報を当該他装置から取得したときに、前記登録手段に登録された当該他装置の指令情報を当該他装置に送信する送信手段と、
を具備することを特徴とする音声指令端末装置。 - 前記他装置が複数存在し、この複数の他装置の中から任意に選択された他装置に応じて、前記認識された音声に対応する指令情報を選択することを特徴とする請求項1記載の音声指令端末装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10504698A JP3728921B2 (ja) | 1998-04-15 | 1998-04-15 | 音声指令端末装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10504698A JP3728921B2 (ja) | 1998-04-15 | 1998-04-15 | 音声指令端末装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH11296187A JPH11296187A (ja) | 1999-10-29 |
| JP3728921B2 true JP3728921B2 (ja) | 2005-12-21 |
Family
ID=14397066
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10504698A Expired - Fee Related JP3728921B2 (ja) | 1998-04-15 | 1998-04-15 | 音声指令端末装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3728921B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN104157055A (zh) * | 2014-08-07 | 2014-11-19 | 成都信鑫信息技术有限公司 | 具有远程报警功能的防盗门锁 |
-
1998
- 1998-04-15 JP JP10504698A patent/JP3728921B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH11296187A (ja) | 1999-10-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4135307B2 (ja) | 音声通訳サービス方法および音声通訳サーバ | |
| CA2156610C (en) | Voice command control and verification system and method | |
| US6601762B2 (en) | Point-of-sale (POS) voice authentication transaction system | |
| US20130325474A1 (en) | Speech recognition adaptation systems based on adaptation data | |
| US20130325459A1 (en) | Speech recognition adaptation systems based on adaptation data | |
| JP2002073563A (ja) | サービス・ファシリティへの安全なアクセスを提供する装置、方法およびプログラム製品 | |
| US20020007278A1 (en) | Speech activated network appliance system | |
| JP2005203928A (ja) | 情報伝達システム及び方法 | |
| WO2020054002A1 (ja) | 情報処理装置、ユーザー認証ネットワークシステム及びユーザー認証方法 | |
| JP3728921B2 (ja) | 音声指令端末装置 | |
| KR20140011881A (ko) | 제어권 이동을 통한 원격제어시스템 및 방법 | |
| US20220044689A1 (en) | Authentication method, authentication system, smart speaker and program | |
| KR101740402B1 (ko) | 음파 신호를 이용한 모바일 어플리케이션 구동 방법 및 이를 구현하기 위한 모바일 어플리케이션 구동 시스템 | |
| CN112085506A (zh) | 一种交易方法及装置、终端、可读存储介质 | |
| JP7553652B2 (ja) | ユーザー認証方法 | |
| TWI901017B (zh) | 基於臉部辨識的人工智能聲控銀行交易系統 | |
| JP2002049591A (ja) | 個人認証システムおよび個人認証方法 | |
| JPH0192800A (ja) | 自動装置 | |
| TWM635534U (zh) | 人工智能聲控銀行交易系統 | |
| JPH10222750A (ja) | 取引処理システム | |
| JP3592415B2 (ja) | 話者認識システム | |
| JP3506293B2 (ja) | 話者識別システム | |
| JP7254316B1 (ja) | プログラム、情報処理装置、及び方法 | |
| TWI901016B (zh) | 互動式人工智能聲控銀行交易系統 | |
| JP2839524B2 (ja) | 音声入力システム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050613 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050621 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050815 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050913 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050926 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081014 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091014 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091014 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101014 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101014 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111014 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111014 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121014 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121014 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131014 Year of fee payment: 8 |
|
| LAPS | Cancellation because of no payment of annual fees |