JP2006011641A - 情報入力方法及びその装置 - Google Patents
情報入力方法及びその装置 Download PDFInfo
- Publication number
- JP2006011641A JP2006011641A JP2004185249A JP2004185249A JP2006011641A JP 2006011641 A JP2006011641 A JP 2006011641A JP 2004185249 A JP2004185249 A JP 2004185249A JP 2004185249 A JP2004185249 A JP 2004185249A JP 2006011641 A JP2006011641 A JP 2006011641A
- Authority
- JP
- Japan
- Prior art keywords
- input
- information
- candidate
- information input
- display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
【課題】 本発明は、迅速な入力を行うことができ、入力の精度が高く情報入力方法及びその装置を提供することを目的とする。
【解決手段】 手入力により確定情報を入力するとともに認識により確度が完全ではない確率情報を入力する情報入力方法であって、確率情報について複数の候補を表示手段に提示し、提示された前記複数の候補から単一の候補を前記確定情報の入力により選択して確定する。
【選択図】 図1
【解決手段】 手入力により確定情報を入力するとともに認識により確度が完全ではない確率情報を入力する情報入力方法であって、確率情報について複数の候補を表示手段に提示し、提示された前記複数の候補から単一の候補を前記確定情報の入力により選択して確定する。
【選択図】 図1
Description
本発明は、情報入力方法及びその装置に関し、入力により入力内容が一意的に確定する確定情報と入力により入力内容が一意的に確定せず確率的に扱われる確率情報とを併用して情報入力を行う情報入力方法及びその装置に関する。
背景として、コールセンタでの入力を例として説明する。ユーザからの製品に対する質問、クレーム、注文等を電話にて受付けるコールセンタシステムでは、コールセンタのオペレータがキーボードやマウスを用いて手入力を行うとともに、ユーザやオペレータの声を音声認識してシステムに対し入力を行うことが考えられている。
この場合、キーボードまたはマウスでの入力は、入力により入力内容が一意的に確定する情報であり、本明細書及び特許請求項の範囲では、確定情報と呼ぶ。音声認識での入力は、認識の誤りや一部分のみの認識が発生する場合があり、入力内容が一意的に確定しないため、本明細書及び特許請求項の範囲では、確率情報と呼ぶ。このような確率情報としては、音声認識入力の他に、画像認識入力やOCR認識入力等がある。これらはいずれも入力が確定的でないという属性を有している。
コールセンタの事例では先行技術として、例えば特許文献1,2に記載の技術が存在する。特許文献1には、利用者の音声を認識して認識結果を表示し、オペレータは表示された認識結果を参照しながら利用者の音声を復唱し、このオペレータの音声を認識して、利用者の音声の認識結果とオペレータの音声の認識結果のうち、認識率の高い方を最終的な認識結果として選択し入力処理を行うことが記載されている。
また、特許文献2には、受信側の特定話者の音声を音声認識した特定話者データと、発信側の不特定話者の音声を音声認識した不特定話者データと、特定話者が通話と同時に入力したキーボードデータを注釈データに含め、不特定話者の会話に対して特定話者が復唱して音声認識を容易にすることが記載されている。
特開平10−322450号公報
特開2003−316374号公報
確定情報であるキーボードまたはマウスでの入力と、確率情報である音声認識等での入力には、以下に示す問題が存在する。確定情報であるキーボードまたはマウスでの入力には時間を要する。キーボード入力では入力語の全てを間違いなく入力する必要があり、時間を要するとともに、オペレータの意識の集中を必要となる。更に、コールセンタでオペレータが会話中にキーボードで入力する場合にはユーザとの会話に集中できない、誤入力の発生、事後入力での入力漏れの発生等の問題が生じる。
一方、確率情報である音声認識入力には誤認識の問題がある。音声認識の基本的な仕組みは、あらかじめ登録された候補語から音声認識された言葉の音に最も近いものを選択する構成である。このような入力形態では、候補語の数が多くなるとともに音声認識が難しくなり、正しい候補語が選択される可能性が少なくなる。この問題は音声認識の認識率が向上した現在でも完全には解決されない問題である。音声認識のほか、画像認識やOCR認識の他の入力手段を用いてもこのような問題が潜在的に存在する。
以下、コールセンタの例でいうと、オペレータがキーボードやマウスを用いて手入力を行うと、入力に時間がかかる。音声認識では、認識率(確度)の最も高い候補語を1つだけ選択し、この選択した候補語を入力している。しかし、音声認識の認識率は100%ではないために、最大の確度が得られた候補語が必ずしも正解の単語ではなく、入力の精度が低いという問題があった。
また、音声認識では、候補語が増えるほど認識率が低下し、コールセンタに適用した場合に候補語が多くなれば、それだけ認識率が低下するという問題があった。
本発明は、上記の点に鑑みなされたものであり、迅速な入力を行うことができ、入力の精度が高く情報入力方法及びその装置を提供することを目的とする。
請求項1に記載の発明は、確定情報を入力するとともに確度が完全ではない確率情報を入力する情報入力方法であって、
前記確率情報について複数の候補を表示手段に提示し、
提示された前記複数の候補から単一の候補を前記確定情報の入力により選択して確定することにより、迅速な入力を行うことができ、入力の精度が高くなる。
前記確率情報について複数の候補を表示手段に提示し、
提示された前記複数の候補から単一の候補を前記確定情報の入力により選択して確定することにより、迅速な入力を行うことができ、入力の精度が高くなる。
請求項2に記載の発明は、確定情報を入力する確定情報入力手段と、
確度が完全ではない確率情報を入力し複数の候補を得る確率情報入力手段と、
前記確率情報について複数の候補を表示手段に提示する候補表示手段と、
提示された前記複数の候補から単一の候補を前記確定情報入力手段の入力により選択して確定する選択確定手段を有することにより、迅速な入力を行うことができ、入力の精度が高くなる。
確度が完全ではない確率情報を入力し複数の候補を得る確率情報入力手段と、
前記確率情報について複数の候補を表示手段に提示する候補表示手段と、
提示された前記複数の候補から単一の候補を前記確定情報入力手段の入力により選択して確定する選択確定手段を有することにより、迅速な入力を行うことができ、入力の精度が高くなる。
請求項3に記載の発明は、請求項2記載の情報入力装置において、
前記確率情報入力手段で入力される確率情報に対する候補を前記確定情報入力手段で入力された確定情報に対応する候補だけに制限する第1候補制限手段を
有することにより、確度の高い候補を得ることができ、入力の精度が高くなる。
前記確率情報入力手段で入力される確率情報に対する候補を前記確定情報入力手段で入力された確定情報に対応する候補だけに制限する第1候補制限手段を
有することにより、確度の高い候補を得ることができ、入力の精度が高くなる。
請求項4に記載の発明は、請求項2記載の情報入力装置において、
前記確率情報入力手段で入力される複数項目のいずれかに対する候補を前記確定情報入力手段の入力により選択する入力項目選択手段と、
確率情報に対する候補を前記入力項目選択手段で選択された項目に対応する候補だけに制限する第2候補制限手段を有することにより、確度の高い候補を得ることができ、入力の精度が高くなる。
前記確率情報入力手段で入力される複数項目のいずれかに対する候補を前記確定情報入力手段の入力により選択する入力項目選択手段と、
確率情報に対する候補を前記入力項目選択手段で選択された項目に対応する候補だけに制限する第2候補制限手段を有することにより、確度の高い候補を得ることができ、入力の精度が高くなる。
請求項5に記載の発明は、請求項2記載の情報入力装置において、
前記確率情報入力手段で入力される確率情報を構成する一部を前記確定情報入力手段の入力により選択する部分選択手段と、
前記確率情報入力手段で入力される確率情報に対する候補を前記部分選択手段で選択された文字を有する候補だけに制限する第3候補制限手段を有することにより、確度の高い候補を得ることができ、入力の精度が高くなる。
前記確率情報入力手段で入力される確率情報を構成する一部を前記確定情報入力手段の入力により選択する部分選択手段と、
前記確率情報入力手段で入力される確率情報に対する候補を前記部分選択手段で選択された文字を有する候補だけに制限する第3候補制限手段を有することにより、確度の高い候補を得ることができ、入力の精度が高くなる。
本発明によれば、迅速な入力を行うことができ、入力の精度が高くなる。
以下、図面に基づいて本発明の実施形態について説明する。
図1は、本発明の情報入力装置の一実施形態のブロック図を示す。情報入力装置は、専用の装置構成とすることもできるが、例えば、汎用のパーソナルコンピュータ、ワークステーション等を適用することができる。
図1において、情報入力装置は、回線制御装置11と、演算処理装置12と、メモリ装置13と、データベース14と、入力装置15と、出力装置16から構成されており、これらはシステムバス17で相互に接続されている。
回線制御装置11は、公衆回線18を介して接続されたユーザの電話機19からの音声信号を受信し、入力装置15内のマイクロホンで得られたオペレータの音声信号を公衆回線18からユーザの電話機に送信する。また、回線制御装置11は回線の接続/切断の制御を行う。
演算処理装置12は、メモリ装置13に記憶されている音声認識を含む各種処理のソフトウエアプログラムを実行する。データベース14には情報入力処理で用いられる各種データベース(DB)が構築されている。入力装置15は、マイクロホン、キーボード、マウス等を備えており、また、マイクロホンからのオペレータの音声信号をデジタル化するAD変換器を有している。出力装置16は、表示手段としてのディスプレイ、プリンタ等を備えている。
図2は、本発明の情報入力装置の一実施形態の機能構成図を示す。図2に示す各機能は演算処理装置12で実行されるソフトウエアによって実現される。同図中、キーボード入力処理手段20は、オペレータの操作による入力装置15のキーボードからの入力情報を読み取り画面入力処理手段24に供給する。
また、マウス入力処理手段22は、オペレータの操作による入力装置15のマウスからの入力情報を読み取り画面入力処理手段24に供給する。画面入力処理手段24は、上記キーボードまたはマウスからの入力情報を確定情報として出力装置16のディスプレイ等の表示手段に反映させるため入力内容解析手段26に供給する。
マイク入力処理手段28は、オペレータの発話を入力装置15のマイクロホンで変換した音声信号を取り込み音声認識処理手段30に供給する。音声認識処理手段30は、データベース14内の音声認識候補DB(データベース)32に予め登録されている文書構造候補及び候補語を使用して、マイク入力処理手段28から供給される音声信号の音声認識を行い、認識結果としての複数の候補語及び確度を確率情報として入力内容解析手段26に供給する。上記の音声認識は、文書全体を認識するのではなく、文書内の予め登録された候補語のみを認識するワードスポット認識を行う。
入力内容解析手段26は、画面入力処理手段24から供給された確定情報を音声認識処理手段30に通知するとともに、音声認識処理手段30から供給された確率情報から項目毎に同一内容の候補語を1つの候補語にまとめ、項目毎に候補語を確度が高い順に表示する表示要求を生成し、かつ、確定情報を表示するための表示要求を生成して応答制御手段36に供給する。応答制御手段36は、メモリ装置13内の回答履歴保持手段38、データベース14内の商品情報DB40及び回答情報DB42を使用して表示内容を決定し、出力内容生成手段44に供給する。
出力内容生成手段44は、表示内容に応じた画面表示するための画面レイアウトデータや文字、数字、記号等のキャラクタデータを生成して画面出力処理手段46に画面出力要求を出す。画面出力処理手段46は、画面出力要求を基に表示画面の画像データを生成する。この画像データはディスプレイ出力処理手段48を経て出力装置16のディスプレイ等の表示手段に供給され表示される。
図3にコールセンタにおける対話の一実施形態のシーケンスを示す。同図中、ユーザからの発信に対してオペレータが応じると、ユーザは要件(1)「ノートパソコンの問い合わせです。」を発話する。これに対してオペレータは応答(1)「ノートパソコンのご質問ですね。機種名をどうぞ。」を発話し、次に、要件(2)「A120です。」を発話すると、オペレータは応答(2)「A120ですね。」を発話している。
図4は、音声認識候補DB32に登録されている文書構造候補の一実施形態を示す。文書構造候補(1)は商品カテゴリを認識させる文書構造であり、文書構造候補(2)は対処内容を認識させる文書構造である。文書構造候補(3)は機種名を認識させる文書構造であり、文書構造候補(4)は商品カテゴリと対処内容を認識させる文書構造である。文書構造候補(5)は商品カテゴリと機種名を認識させる文書構造であり、文書構造候補(6)は機種名と対処内容を認識させる文書構造である。
図5は、音声認識候補DB32に登録されている候補語の一実施形態を示す。図5(A)は商品カテゴリの項目の候補語のテーブルであり、例えば候補語「ノートパソコン」に対応して、その読みとしての音声データが登録されている。図5(B)は対処内容の項目の候補語のテーブルであり、例えば候補語「質問」に対応して、その読みとしての音声データが登録され、また、各候補語のカテゴリ「ご質問」、「ご指摘」、「ご注文」等が登録されている。図5(C)は機種名の項目の候補語のテーブルであり、例えば候補語「A110」に対応して、その読みとしての音声データ「えーいちいちまる」や「えーいちいちぜろ」が登録され、また、各候補語の商品カテゴリ「デスクトップパソコン」等が登録されている。
次に、図3に示すコールセンタにおける対話が行われ、応答(2)がなされた場合の確率情報表示処理について説明する。
図6は、本発明の情報入力装置が実行する確率情報入力処理の一実施形態のフローチャートを示す。同図中、ステップS11でオペレータが音声入力を行うと、マイク入力処理手段28はオペレータの音声信号を取り込み音声認識処理手段30に供給する。ステップS12で、音声認識処理手段30は音声認識候補DB32に予め登録されている文書構造候補及び候補語を使用して上記音声信号の音声認識を行い、認識結果としての複数の候補語及び確度を確率情報として入力内容解析手段26に供給する。
ステップS13で、入力内容解析手段26は音声認識処理手段30から供給される確率情報を表示して確定させるための表示要求を生成して応答制御手段36に供給する。ステップS14で、応答制御手段36は、メモリ装置13内の回答履歴保持手段38、データベース14内の商品情報DB40及び回答情報DB42を使用して表示内容を決定し、出力内容生成手段44に供給する。
ステップS15で、出力内容生成手段44は表示の内容に応じた画面レイアウトデータやキャラクタデータを生成して画面出力処理手段46に画面出力要求を出す。画面出力処理手段46は画面出力要求を基に表示画面の画像データを生成してディスプレイに画面表示し、オペレータに確定情報の入力を促す。
ここで、オペレータの応答(1),(2)から音声認識処理手段30は、図7(A)に示す商品カテゴリの3つの候補語とその確度と、図7(B)に示す対処内容の3つの候補語とその確度と、図7(C)に示す機種名の2つの候補語とその確度を確率情報として入力内容解析手段26に供給する。
入力内容解析手段26は、音声認識処理手段30から供給された確率情報のうち同一内容の候補語を1つの項目にまとめ、図8(A)に示す商品カテゴリの2つの候補語とその確度を応答制御手段36に供給する。対処内容と機種名については同一内容の候補語がないため図8(B),(C)に示す項目を応答制御手段36に供給する。
この結果、ディスプレイには図9に示すように、商品カテゴリ、機種名、対処内容それぞれの確定表示領域50,51,52の近傍に商品カテゴリ、機種名、対処内容それぞれの候補語表55,56,57が表示される。候補語表55,56,57には一または複数の候補語とその確度を表示する。なお、候補語表55,56,57には少なくとも候補語が表示されれば良く、確度は必ずしも表示する必要はない。
図10は、本発明の情報入力装置が実行する確率情報の確定処理の一実施形態のフローチャートを示す。この処理は、図9に示すように確率情報を表示している状態でキーボードやマウスの操作により実行される。
図10において、ステップS21で、オペレータがキーボードまたはマウスで入力操作を行うと、キーボード入力処理手段20またはマウス入力処理手段22はオペレータの操作に応じ候補語表55,56,57それぞれから特定の候補語を選択する入力情報を読み取り、画面入力処理手段24は上記入力情報で選択された候補語を確定情報として入力内容解析手段26に供給する。
ステップS22で、入力内容解析手段26は確定情報としての選択された候補語を確定表示領域50,51,52それぞれに表示させるための表示要求を生成して応答制御手段36に供給する。なお、入力内容解析手段26は候補語が選択された項目については候補語表55,56,57の表示を停止させる。
ステップS23で、応答制御手段36は表示内容に応じた画面レイアウトデータやキャラクタデータを生成して画面出力処理手段46に画面出力要求を出し、これに応じたディスプレイ表示が行われる。
図11は、本発明の情報入力装置が実行する確定情報の入力による確率情報制限処理の一実施形態のフローチャートを示す。同図中、ステップS31で、オペレータがキーボードまたはマウスで入力操作を行うと、キーボード入力処理手段20またはマウス入力処理手段22は確定表示領域50に記入する入力情報(例えば「ノートパソコン」)を読み取り、画面入力処理手段24は上記入力情報を確定情報として入力内容解析手段26に供給する。
ステップS32で、入力内容解析手段26は確定情報としての選択された候補語を確定表示領域50に表示させるための表示要求を生成して応答制御手段36に供給し、出力内容生成手段44に通知する。出力内容生成手段44は表示内容に応じた画面レイアウトデータやキャラクタデータを生成して画面出力処理手段46に画面出力要求を出し、これに応じて図12に示すように、確定表示領域50に「ノートパソコン」が記入されたディスプレイ表示が行われる。
ステップS33で、入力内容解析手段26は上記確定情報を音声認識処理手段30に通知する。ステップS34で、音声認識処理手段30は音声認識候補DB32に予め登録されている候補語のうち上記確定情報に対応する候補語のみを抽出する。
次に、ステップS35でオペレータが音声入力を行うと、マイク入力処理手段28はオペレータの音声信号を取り込み音声認識処理手段30に供給する。ステップS36で、音声認識処理手段30は音声認識候補DB32に予め登録されている文書構造候補及び抽出した候補語を使用して上記音声信号の音声認識を行う。
このようにして得られた認識結果としての複数の候補語及び確度は確率情報として入力内容解析手段26に供給され、図6のフローチャートと同様にしてディスプレイ表示される。この場合、音声認識候補DB32の機種名の候補語のテーブルには、図12に示すように、デスクトップパソコン及びノートパソコンを含む候補語が登録されているが、確定情報「ノートパソコン」に対応する候補語のみが抽出され音声認識に使用されるため、音声認識の認識率(確度)を向上できる。なお、図12に示す機種名の候補語はディスプレイ画面に表示されるわけではない。
図10に示す確率情報の確定処理では、候補語表55,56,57それぞれについてオペレータがマウス等で特定の候補語を選択することで確定情報としているが、図5(C)に示す音声認識候補DB32の機種名の候補語のテーブルには、機種名とともに商品カテゴリが登録されているため、商品カテゴリに対し下位概念である機種名が確定すると、商品カテゴリも確定できる。このため、図13に示す候補語表56から機種名「A120」がマウス等で選択されて確定されると同時に、候補語表55から商品カテゴリ「ノートパソコン」が確定させる。これによって、オペレータの操作を少なくできる。
図14は、本発明の情報入力装置が実行する入力項目選択による確率情報制限処理の一実施形態のフローチャートを示す。同図中、ステップS41で、オペレータがキーボードまたはマウスでカーソルを確定表示領域50〜52のいずれかに移動させる入力操作を行うと、キーボード入力処理手段20またはマウス入力処理手段22はカーソル位置を入力項目指示の入力情報として読み取り、画面入力処理手段24は上記入力情報を確定情報として入力内容解析手段26に供給する。図15に、カーソル60で確定表示領域51を入力項目として指示したディスプレイ表示の一例を示す。
ステップS42で、入力内容解析手段26は上記入力項目指示の確定情報を音声認識処理手段30に通知する。ステップS43で、音声認識処理手段30は音声認識候補DB32に予め登録されている候補語のうち上記入力項目指示の確定情報に対応する候補語のみを抽出する。
次に、ステップS44でオペレータが音声入力を行うと、マイク入力処理手段28はオペレータの音声信号を取り込み音声認識処理手段30に供給する。ステップS45で、音声認識処理手段30は音声認識候補DB32に予め登録されている文書構造候補及び抽出した候補語を使用して上記音声信号の音声認識を行う。
このようにして得られた認識結果としての複数の候補語及び確度は確率情報として入力内容解析手段26に供給され、図6のフローチャートと同様にしてディスプレイ表示される。
この場合、音声認識候補DB32には図5に示すように商品カテゴリ,機種名,対処内容それぞれの項目の候補語が登録されているが、図15に示すように、入力項目指示の確定情報「機種名」に対応する機種名の候補語のみが抽出され音声認識に使用されるため、音声認識の認識率(確度)を向上できる。なお、図15に示す機種名の候補語はディスプレイ画面に表示されるわけではない。
図16は、本発明の情報入力装置が実行する対話例選択による対処内容決定処理の一実施形態のフローチャートを示す。同図中、ステップS51で、応答制御手段36は、商品カテゴリと機種名が確定した状態で、回答情報DB42を使用して商品カテゴリと機種名に対応する対話例をディスプレイに表示する。図17に、対話例62を表示したディスプレイ表示の一例を示す。対話例としては、商品カテゴリと機種名が確定した状態でオペレータがユーザに対して話すことが多い例文を対処内容のカテゴリとともに表示する。
ステップS52で、オペレータがキーボードまたはマウスでカーソルを対話例62のいずれかの例文に移動させる入力操作を行うと、キーボード入力処理手段20またはマウス入力処理手段22はカーソル位置をカテゴリ指示の入力情報として読み取り、画面入力処理手段24は上記入力情報を確定情報として入力内容解析手段26に供給する。
ステップS53で、入力内容解析手段26は上記カテゴリ指示の確定情報を表示領域52に表示させるための表示要求を生成して応答制御手段36に供給する。それ以降、図6のフローチャートと同様にしてディスプレイ表示される。
図18は、本発明の情報入力装置が実行する1文字選択による確率情報制限処理の一実施形態のフローチャートを示す。ここでは、図19に示すように、確定表示領域50に「ノートパソコン」が記入されて確定され、機種名の確定表示領域51の近傍に文字選択表64がディスプレイ表示されている状態からのフローチャートを示す。
図18において、ステップS61で、オペレータがキーボードまたはマウスでカーソルを文字選択表64のいずれかの文字に移動させる入力操作を行うと、ステップS62で、キーボード入力処理手段20またはマウス入力処理手段22はカーソル位置を1文字指示の入力情報として取り込み、画面入力処理手段24は上記入力情報を確定情報として入力内容解析手段26に供給する。
ステップS63で、入力内容解析手段26は上記確定情報を音声認識処理手段30に通知する。ステップS64で、音声認識処理手段30は音声認識候補DB32に予め登録されている候補語のうち上記1文字指示の確定情報に対応する候補語のみを抽出する。
次に、ステップS65でオペレータが音声入力を行うと、マイク入力処理手段28はオペレータの音声信号を取り込み音声認識処理手段30に供給する。ステップS66で、音声認識処理手段30は音声認識候補DB32に予め登録されている文書構造候補及び抽出した候補語を使用して上記音声信号の音声認識を行う。
このようにして得られた認識結果としての複数の候補語及び確度は確率情報として入力内容解析手段26に供給され、図6のフローチャートと同様にしてディスプレイ表示される。この場合、音声認識候補DB32の機種名の候補語のテーブルには、図19に示すように、ノートパソコンの候補語が登録されているが、1文字指示の確定情報「A」に対応する候補語のみが抽出され音声認識に使用されるため、音声認識の認識率(確度)を向上できる。なお、図19に示す機種名の候補語はディスプレイ画面に表示されるわけではない。
図20は、本発明の情報入力装置が実行する処理フロー選択による対処内容決定処理の一実施形態のフローチャートを示す。同図中、ステップS71で、応答制御手段36は、回答情報DB42を使用して処理フローをディスプレイに表示する。図21に、処理フロー66を表示したディスプレイ表示の一例を示す。処理フロー66としては、オペレータが選択する分岐部に対処内容のカテゴリ67,68等が表示されている。
ステップS72で、オペレータがキーボードまたはマウスでカーソルを処理フロー66のいずれかのカテゴリ67,68に移動させる入力操作を行うと、キーボード入力処理手段20またはマウス入力処理手段22はカーソル位置をカテゴリ指示の入力情報として読み取り、画面入力処理手段24は上記入力情報を確定情報として入力内容解析手段26に供給する。
ステップS73で、入力内容解析手段26は上記カテゴリ指示の確定情報を表示領域52に表示させるための表示要求を生成して応答制御手段36に供給する。それ以降、図6のフローチャートと同様にしてディスプレイ表示される。
図22は、本発明の情報入力装置が実行する候補語の表示順変更処理の一実施形態のフローチャートを示す。同図中、ステップS81でオペレータが例えば「ノートパソコン」の音声入力を行うと、マイク入力処理手段28はオペレータの音声信号を取り込み音声認識処理手段30に供給する。
ステップS82で、音声認識処理手段30は音声認識候補DB32に予め登録されている文書構造候補及び候補語を使用して上記音声信号の音声認識を行い、認識結果としての複数の候補語及び確度を確率情報として入力内容解析手段26に供給する。
ステップS83で、入力内容解析手段26は音声認識処理手段30から供給される確率情報を表示して確定させるための表示要求を生成して応答制御手段36に供給する。
ステップS84で、応答制御手段36は、メモリ装置13内の回答履歴保持手段38、データベース14内の商品情報DB40及び回答情報DB42を使用して候補語表55の表示内容を決定し、出力内容生成手段44に供給する。この際に、応答制御手段36は、回答履歴保持手段38から上記音声入力に対する確度が最大の候補語「ノートパソコン」に対する回答履歴を抽出し、回答(つまり対処内容)の利用頻度に応じて対処内容を並び替えて候補語表57の表示内容とし、出力内容生成手段44に供給する。
図23に、対処内容を並び替えて表示したディスプレイ画面の一例を示す。ここでは、回答の利用頻度に応じて並び替えた結果、候補語表57には「ご質問」、「ご指摘」、「ご注文」の順にカテゴリが表示されている。
ステップS85で、出力内容生成手段44は表示の内容に応じた画面レイアウトデータやキャラクタデータを生成して画面出力処理手段46に画面出力要求を出す。画面出力処理手段46は画面出力要求を基に表示画面の画像データを生成してディスプレイに画面表示し、オペレータに確定情報の入力を促す。
図24は、本発明の情報入力装置が実行する候補語の確度変更処理の一実施形態のフローチャートを示す。同図中、ステップS91でオペレータが例えば「ノートパソコン」と「A120」の音声入力を行うと、マイク入力処理手段28はオペレータの音声信号を取り込み音声認識処理手段30に供給する。
ステップS92で、音声認識処理手段30は音声認識候補DB32に予め登録されている文書構造候補及び候補語を使用して上記音声信号の音声認識を行い、認識結果としての複数の候補語及び確度を確率情報として入力内容解析手段26に供給する。
ステップS93で、入力内容解析手段26は音声認識処理手段30から供給される確率情報を表示して確定させるための表示要求を生成して応答制御手段36に供給する。
ステップS94で、応答制御手段36は、メモリ装置13内の回答履歴保持手段38、データベース14内の商品情報DB40及び回答情報DB42を使用して候補語表55の表示内容を決定し、出力内容生成手段44に供給する。この際に、応答制御手段36は、回答履歴保持手段38から上記音声入力の「ノートパソコン」と「A120」に対する回答履歴を抽出し、「ノートパソコン」と「A120」が同時に使用される同時使用確率を抽出し、この同時使用確率に応じて候補語「ノートパソコン」,「A120」それぞれの確度を変更し、候補語表55,56の表示内容として出力内容生成手段44に供給する。
図25に、候補語「ノートパソコン」,「A120」それぞれの確度を変更して表示したディスプレイ画面の一例を示す。ここでは、音声認識における候補語「ノートパソコン」の確度は80%で、音声認識における候補語「ノートパソコン」の確度は80%であったが、「ノートパソコン」と「A120」の同時使用確率が90%であったために、候補語表55,56の表示内容としては「ノートパソコン 90%」、「ノートパソコン 90%」に変更されている。
ステップS95で、出力内容生成手段44は表示の内容に応じた画面レイアウトデータやキャラクタデータを生成して画面出力処理手段46に画面出力要求を出す。画面出力処理手段46は画面出力要求を基に表示画面の画像データを生成してディスプレイに画面表示し、オペレータに確定情報の入力を促す。
なお、ところで、上記の実施形態では音声認識を例として説明したが、音声認識の代りに画像認識を行うものであっても良く、上記の実施形態に限定されるものではない。この場合、マイク入力処理手段28を画像入力処理手段に変更し、音声認識処理手段30を画像認識処理手段に変更し、音声認識候補DBを画像認識候補DBに変更する。
なお、キーボード入力処理手段20,マウス入力処理手段22,画面入力処理手段24が請求項記載の確定情報入力手段に対応し、マイク入力処理手段28,音声認識処理手段30,音声認識候補DB32が確率情報入力手段に対応し、入力内容解析手段26が選択確定手段に対応し、ステップS34が第1候補制限手段に対応し、ステップS41が入力項目選択手段に対応し、ステップS43が第2候補制限手段に対応し、ステップS62が部分選択手段に対応し、ステップS64が第3候補制限手段に対応する。
(付記1)
確定情報を入力するとともに認識により確度が確率情報を入力する情報入力方法であって、
前記確率情報について複数の候補を表示手段に提示し、
提示された前記複数の候補から単一の候補を前記確定情報の入力により選択して確定することを特徴とする情報入力方法。
(付記2)
確定情報を入力する確定情報入力手段と、
確度が完全ではない確率情報を入力し複数の候補を得る確率情報入力手段と、
前記確率情報について複数の候補を表示手段に提示する候補表示手段と、
提示された前記複数の候補から単一の候補を前記確定情報入力手段の入力により選択して確定する選択確定手段を
有することを特徴とする情報入力装置。
(付記3)
付記2記載の情報入力装置において、
前記確率情報入力手段で入力される確率情報に対する候補を前記確定情報入力手段で入力された確定情報に対応する候補だけに制限する第1候補制限手段を
有することを特徴とする情報入力装置。
(付記4)
付記2記載の情報入力装置において、
前記確率情報入力手段で入力される複数項目のいずれかに対する候補を前記確定情報入力手段の入力により選択する入力項目選択手段と、
確率情報に対する候補を前記入力項目選択手段で選択された項目に対応する候補だけに制限する第2候補制限手段を
有することを特徴とする情報入力装置。
(付記5)
付記2記載の情報入力装置において、
前記確率情報入力手段で入力される確率情報を構成する一部を前記確定情報入力手段の入力により選択する部分選択手段と、
前記確率情報入力手段で入力される確率情報に対する候補を前記部分選択手段で選択された文字を有する候補だけに制限する第3候補制限手段を
有することを特徴とする情報入力装置。
(付記6)
付記2記載の情報入力装置において、
前記確率情報入力手段で複数項目の確率情報が入力され、前記選択手段で前記複数項目のいずれかの項目が前記選択確定手段により確定したとき、前記複数項目のうち前記確定した項目の上位概念である項目も同時に確定させることを特徴とする情報入力装置。
(付記7)
付記2記載の情報入力装置において、
前記確率情報入力手段で入力される確率情報と同一内容がディスプレイ表示の中から前記確定情報入力手段の入力により選択されたとき、前記確率情報の候補を同時に確定させることを特徴とする情報入力装置。
(付記8)
付記7記載の情報入力装置において、
前記ディスプレイ表示は対話例のカテゴリであることを特徴とする情報入力装置。
(付記9)
付記7記載の情報入力装置において、
前記ディスプレイ表示は処理フローのカテゴリであることを特徴とする情報入力装置。
(付記10)
付記2記載の情報入力装置において、
前記確率情報入力手段で確率情報が入力されたとき、前記確率情報の過去の履歴に応じて他の項目に対する候補の表示順序を変更させることを特徴とする情報入力装置。
(付記1)
確定情報を入力するとともに認識により確度が確率情報を入力する情報入力方法であって、
前記確率情報について複数の候補を表示手段に提示し、
提示された前記複数の候補から単一の候補を前記確定情報の入力により選択して確定することを特徴とする情報入力方法。
(付記2)
確定情報を入力する確定情報入力手段と、
確度が完全ではない確率情報を入力し複数の候補を得る確率情報入力手段と、
前記確率情報について複数の候補を表示手段に提示する候補表示手段と、
提示された前記複数の候補から単一の候補を前記確定情報入力手段の入力により選択して確定する選択確定手段を
有することを特徴とする情報入力装置。
(付記3)
付記2記載の情報入力装置において、
前記確率情報入力手段で入力される確率情報に対する候補を前記確定情報入力手段で入力された確定情報に対応する候補だけに制限する第1候補制限手段を
有することを特徴とする情報入力装置。
(付記4)
付記2記載の情報入力装置において、
前記確率情報入力手段で入力される複数項目のいずれかに対する候補を前記確定情報入力手段の入力により選択する入力項目選択手段と、
確率情報に対する候補を前記入力項目選択手段で選択された項目に対応する候補だけに制限する第2候補制限手段を
有することを特徴とする情報入力装置。
(付記5)
付記2記載の情報入力装置において、
前記確率情報入力手段で入力される確率情報を構成する一部を前記確定情報入力手段の入力により選択する部分選択手段と、
前記確率情報入力手段で入力される確率情報に対する候補を前記部分選択手段で選択された文字を有する候補だけに制限する第3候補制限手段を
有することを特徴とする情報入力装置。
(付記6)
付記2記載の情報入力装置において、
前記確率情報入力手段で複数項目の確率情報が入力され、前記選択手段で前記複数項目のいずれかの項目が前記選択確定手段により確定したとき、前記複数項目のうち前記確定した項目の上位概念である項目も同時に確定させることを特徴とする情報入力装置。
(付記7)
付記2記載の情報入力装置において、
前記確率情報入力手段で入力される確率情報と同一内容がディスプレイ表示の中から前記確定情報入力手段の入力により選択されたとき、前記確率情報の候補を同時に確定させることを特徴とする情報入力装置。
(付記8)
付記7記載の情報入力装置において、
前記ディスプレイ表示は対話例のカテゴリであることを特徴とする情報入力装置。
(付記9)
付記7記載の情報入力装置において、
前記ディスプレイ表示は処理フローのカテゴリであることを特徴とする情報入力装置。
(付記10)
付記2記載の情報入力装置において、
前記確率情報入力手段で確率情報が入力されたとき、前記確率情報の過去の履歴に応じて他の項目に対する候補の表示順序を変更させることを特徴とする情報入力装置。
11 回線制御装置
12 演算処理装置
13 メモリ装置
14 データベース
15 入力装置
16 出力装置
17 システムバス
20 キーボード入力処理手段
22 マウス入力処理手段
24 画面入力処理手段
26 入力内容解析手段
28 マイク入力処理手段
30 音声認識処理手段
32 音声認識候補DB
36 応答制御手段
38 回答履歴保持手段
40 商品情報DB
42 回答情報DB
44 出力内容生成手段
46 画面出力処理手段
48 ディスプレイ出力処理手段
12 演算処理装置
13 メモリ装置
14 データベース
15 入力装置
16 出力装置
17 システムバス
20 キーボード入力処理手段
22 マウス入力処理手段
24 画面入力処理手段
26 入力内容解析手段
28 マイク入力処理手段
30 音声認識処理手段
32 音声認識候補DB
36 応答制御手段
38 回答履歴保持手段
40 商品情報DB
42 回答情報DB
44 出力内容生成手段
46 画面出力処理手段
48 ディスプレイ出力処理手段
Claims (5)
- 確定情報を入力するとともに確度が完全ではない確率情報を入力する情報入力方法であって、
前記確率情報について複数の候補を表示手段に提示し、
提示された前記複数の候補から単一の候補を前記確定情報の入力により選択して確定することを特徴とする情報入力方法。 - 確定情報を入力する確定情報入力手段と、
確度が完全ではない確率情報を入力し複数の候補を得る確率情報入力手段と、
前記確率情報について複数の候補を表示手段に提示する候補表示手段と、
提示された前記複数の候補から単一の候補を前記確定情報入力手段の入力により選択して確定する選択確定手段を
有することを特徴とする情報入力装置。 - 請求項2記載の情報入力装置において、
前記確率情報入力手段で入力される確率情報に対する候補を前記確定情報入力手段で入力された確定情報に対応する候補だけに制限する第1候補制限手段を
有することを特徴とする情報入力装置。 - 請求項2記載の情報入力装置において、
前記確率情報入力手段で入力される複数項目のいずれかに対する候補を前記確定情報入力手段の入力により選択する入力項目選択手段と、
確率情報に対する候補を前記入力項目選択手段で選択された項目に対応する候補だけに制限する第2候補制限手段を
有することを特徴とする情報入力装置。 - 請求項2記載の情報入力装置において、
前記確率情報入力手段で入力される確率情報を構成する一部を前記確定情報入力手段の入力により選択する部分選択手段と、
前記確率情報入力手段で入力される確率情報に対する候補を前記部分選択手段で選択された文字を有する候補だけに制限する第3候補制限手段を
有することを特徴とする情報入力装置。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004185249A JP2006011641A (ja) | 2004-06-23 | 2004-06-23 | 情報入力方法及びその装置 |
| US10/974,032 US20050288933A1 (en) | 2004-06-23 | 2004-10-26 | Information input method and apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004185249A JP2006011641A (ja) | 2004-06-23 | 2004-06-23 | 情報入力方法及びその装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2006011641A true JP2006011641A (ja) | 2006-01-12 |
Family
ID=35507167
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004185249A Withdrawn JP2006011641A (ja) | 2004-06-23 | 2004-06-23 | 情報入力方法及びその装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US20050288933A1 (ja) |
| JP (1) | JP2006011641A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015156062A (ja) * | 2014-02-19 | 2015-08-27 | 株式会社東芝 | 業務支援システム |
| JP2018045460A (ja) * | 2016-09-14 | 2018-03-22 | 株式会社東芝 | 入力支援装置およびプログラム |
| JP2021089376A (ja) * | 2019-12-05 | 2021-06-10 | Tvs Regza株式会社 | 情報処理装置及びプログラム |
| JP2025119435A (ja) * | 2024-02-01 | 2025-08-14 | パナソニックIpマネジメント株式会社 | オペレータ支援システム、オペレータ支援装置、およびオペレータ支援方法 |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7359979B2 (en) | 2002-09-30 | 2008-04-15 | Avaya Technology Corp. | Packet prioritization and associated bandwidth and buffer management techniques for audio over IP |
| US20040073690A1 (en) | 2002-09-30 | 2004-04-15 | Neil Hepworth | Voice over IP endpoint call admission |
| US7978827B1 (en) | 2004-06-30 | 2011-07-12 | Avaya Inc. | Automatic configuration of call handling based on end-user needs and characteristics |
| US20070219782A1 (en) * | 2006-03-14 | 2007-09-20 | Qing Li | User-supported multi-language online dictionary |
| KR100998566B1 (ko) * | 2008-08-11 | 2010-12-07 | 엘지전자 주식회사 | 음성인식을 이용한 언어 번역 방법 및 장치 |
| US8218751B2 (en) | 2008-09-29 | 2012-07-10 | Avaya Inc. | Method and apparatus for identifying and eliminating the source of background noise in multi-party teleconferences |
| KR102472010B1 (ko) * | 2018-05-04 | 2022-11-30 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 기능 실행 방법 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003150621A (ja) * | 2001-11-12 | 2003-05-23 | Fujitsu Ltd | 対話ブラウジングシステム |
| US7124085B2 (en) * | 2001-12-13 | 2006-10-17 | Matsushita Electric Industrial Co., Ltd. | Constraint-based speech recognition system and method |
| US7363224B2 (en) * | 2003-12-30 | 2008-04-22 | Microsoft Corporation | Method for entering text |
-
2004
- 2004-06-23 JP JP2004185249A patent/JP2006011641A/ja not_active Withdrawn
- 2004-10-26 US US10/974,032 patent/US20050288933A1/en not_active Abandoned
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015156062A (ja) * | 2014-02-19 | 2015-08-27 | 株式会社東芝 | 業務支援システム |
| JP2018045460A (ja) * | 2016-09-14 | 2018-03-22 | 株式会社東芝 | 入力支援装置およびプログラム |
| JP2021089376A (ja) * | 2019-12-05 | 2021-06-10 | Tvs Regza株式会社 | 情報処理装置及びプログラム |
| JP7248564B2 (ja) | 2019-12-05 | 2023-03-29 | Tvs Regza株式会社 | 情報処理装置及びプログラム |
| JP2025119435A (ja) * | 2024-02-01 | 2025-08-14 | パナソニックIpマネジメント株式会社 | オペレータ支援システム、オペレータ支援装置、およびオペレータ支援方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20050288933A1 (en) | 2005-12-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11450311B2 (en) | System and methods for accent and dialect modification | |
| US7853446B2 (en) | Generation of codified electronic medical records by processing clinician commentary | |
| US7548859B2 (en) | Method and system for assisting users in interacting with multi-modal dialog systems | |
| US10839788B2 (en) | Systems and methods for selecting accent and dialect based on context | |
| Rebman Jr et al. | Speech recognition in the human–computer interface | |
| JP2006011641A (ja) | 情報入力方法及びその装置 | |
| CN111902831B (zh) | 演示支援系统 | |
| da Silva et al. | How do illiterate people interact with an intelligent voice assistant? | |
| JP7590672B2 (ja) | ラベル付与支援装置、ラベル付与支援方法およびプログラム | |
| KR20080042104A (ko) | 음성 엔진 훈련의 상호작용 사용자 지도서 내로의 통합 | |
| KR100593589B1 (ko) | 음성인식을 이용한 다국어 통역/학습 장치 및 방법 | |
| Neustein | Advances in speech recognition: mobile environments, call centers and clinics | |
| US20220093086A1 (en) | Method and a system for capturing conversations | |
| JP2018066968A (ja) | 単語学習支援装置、単語学習支援プログラム、単語学習支援方法 | |
| JP6383748B2 (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム | |
| JP4220151B2 (ja) | 音声対話装置 | |
| JP2673831B2 (ja) | 会話マナー教育システム | |
| CN110890095A (zh) | 语音检测方法、推荐方法、装置、存储介质和电子设备 | |
| Abbott et al. | Identifying an aurally distinct phrase set for text entry techniques | |
| JP4042435B2 (ja) | 音声自動質問応答装置 | |
| JP7615923B2 (ja) | 応答システム、応答方法、および応答プログラム | |
| Salvador et al. | Requirement engineering contributions to voice user interface | |
| KR20230086647A (ko) | 외국어 교육용 인공지능 기능을 구비한 사용자 기기 및 외국어 교육 방법 | |
| WO2019026716A1 (ja) | 情報処理装置、及び情報処理方法 | |
| WO2022208692A1 (ja) | 表示用データ生成装置、表示用データ生成方法、及び表示用データ生成プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070904 |