JP2000322088A - 音声認識マイクおよび音声認識システムならびに音声認識方法 - Google Patents
音声認識マイクおよび音声認識システムならびに音声認識方法Info
- Publication number
- JP2000322088A JP2000322088A JP11133659A JP13365999A JP2000322088A JP 2000322088 A JP2000322088 A JP 2000322088A JP 11133659 A JP11133659 A JP 11133659A JP 13365999 A JP13365999 A JP 13365999A JP 2000322088 A JP2000322088 A JP 2000322088A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- recognition
- voice
- microphone
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 カーナビゲーションシステム、小型情報機
器、ゲームなどに用いられる音声認識システムにおい
て、音声認識を使い易いインタフェースにする。 【解決手段】 音声認識処理を実行する機能を有する音
声認識マイク1と、システム本体5とを通信手段4で接
続し、音声認識部13で認識した認識結果をシステム本
体5に転送してシステムを動作させる。音声認識マイク
1は、音響モデル135と音声認識処理部134とを有
する音声認識部13と、コマンド辞書131と認識対象
辞書152とユーザ登録辞書153と、データ通信部1
7とを有し、システム本体5から転送された認識対象辞
書152から必要な単語をユーザ登録辞書154に登録
し、通常は、コマンド辞書151とユーザ登録辞書15
4とを用いて音声認識を行う。
器、ゲームなどに用いられる音声認識システムにおい
て、音声認識を使い易いインタフェースにする。 【解決手段】 音声認識処理を実行する機能を有する音
声認識マイク1と、システム本体5とを通信手段4で接
続し、音声認識部13で認識した認識結果をシステム本
体5に転送してシステムを動作させる。音声認識マイク
1は、音響モデル135と音声認識処理部134とを有
する音声認識部13と、コマンド辞書131と認識対象
辞書152とユーザ登録辞書153と、データ通信部1
7とを有し、システム本体5から転送された認識対象辞
書152から必要な単語をユーザ登録辞書154に登録
し、通常は、コマンド辞書151とユーザ登録辞書15
4とを用いて音声認識を行う。
Description
【0001】
【発明の属する技術分野】本発明は、音声認識システム
および方法にかかわり、カーナビゲーションシステム、
車載用PC、カーエレクトロニクスや、PDA、ハンド
ヘルドPCに代表される小型情報機器、携帯型音声翻訳
機、ならびに、ゲーム機器、家電機器に用いる音声認識
システムであって、特に、カーナビゲーションシステム
や車載用PC、カーエレクトロニクスに代表されるカー
マルチメディア分野において、認識応答時間、認識率向
上の面で、使い勝手の良い音声認識システムおよび方法
に関する。
および方法にかかわり、カーナビゲーションシステム、
車載用PC、カーエレクトロニクスや、PDA、ハンド
ヘルドPCに代表される小型情報機器、携帯型音声翻訳
機、ならびに、ゲーム機器、家電機器に用いる音声認識
システムであって、特に、カーナビゲーションシステム
や車載用PC、カーエレクトロニクスに代表されるカー
マルチメディア分野において、認識応答時間、認識率向
上の面で、使い勝手の良い音声認識システムおよび方法
に関する。
【0002】
【従来の技術】近年、音声認識技術を用いた小型情報シ
ステムが普久しつつある。カーナビゲーションシステム
をはじめとして、PDAに代表される小型情報機器、携
帯型翻訳機等である。このような音声認識システムの例
として、特開平5ー35776号公報には「言語自動選
択機能付翻訳装置」として、マイクから入力した操作者
の音声を認識して、翻訳し、翻訳した言語の音声を出力
するようにした携帯用の翻訳装置に関する技術が開示さ
れている。
ステムが普久しつつある。カーナビゲーションシステム
をはじめとして、PDAに代表される小型情報機器、携
帯型翻訳機等である。このような音声認識システムの例
として、特開平5ー35776号公報には「言語自動選
択機能付翻訳装置」として、マイクから入力した操作者
の音声を認識して、翻訳し、翻訳した言語の音声を出力
するようにした携帯用の翻訳装置に関する技術が開示さ
れている。
【0003】以下、図6を用いて、このような従来技術
にかかわる音声翻訳装置の概要を説明する。図6は、従
来技術にかかわる音声翻訳装置の構成を示すブロック図
である。音声認識手段を備えた音声翻訳装置7は、マイ
ク71と、音声認識部72と、翻訳部73と、制御部7
4と、これら各部72,73,74管でデータを転送す
るバス75とを有して構成される。
にかかわる音声翻訳装置の概要を説明する。図6は、従
来技術にかかわる音声翻訳装置の構成を示すブロック図
である。音声認識手段を備えた音声翻訳装置7は、マイ
ク71と、音声認識部72と、翻訳部73と、制御部7
4と、これら各部72,73,74管でデータを転送す
るバス75とを有して構成される。
【0004】音声認識部72は、音声区間切出部721
と、音声認識処理部722と、音声モデル格納部723
と、音声認識辞書部724とを有して構成される。
と、音声認識処理部722と、音声モデル格納部723
と、音声認識辞書部724とを有して構成される。
【0005】翻訳部73は、翻訳語データ用メモリカー
ド731と、音声合成部732と、表示部735とを有
している。さらに、音声合成部732には、スピーカア
ンプ733と、スピーカ734が接続されている。
ド731と、音声合成部732と、表示部735とを有
している。さらに、音声合成部732には、スピーカア
ンプ733と、スピーカ734が接続されている。
【0006】マイク71は、ユーザの音声などを電気信
号に変換して入力する。
号に変換して入力する。
【0007】音声区間切出部721は、マイク71から
入力された音声と雑音を含んだ音声信号をデジタル信号
に変換するとともに音声区間を切り出し、音声区間の信
号を音声認識処理部722に送る。
入力された音声と雑音を含んだ音声信号をデジタル信号
に変換するとともに音声区間を切り出し、音声区間の信
号を音声認識処理部722に送る。
【0008】音声認識処理部722は、キーボード又は
スイッチ等による操作信号79を受けた制御部74の指
示により、マイク71、音声区間切出部721を経て、
切り出された音声を音響モデル格納部723に格納され
た音響モデルを用いて分析する。さらに、音声認識処理
部722は、分析した結果を、音声認識辞書部724に
格納された標準音声パターンと比較することによって、
音声認識を行う。
スイッチ等による操作信号79を受けた制御部74の指
示により、マイク71、音声区間切出部721を経て、
切り出された音声を音響モデル格納部723に格納され
た音響モデルを用いて分析する。さらに、音声認識処理
部722は、分析した結果を、音声認識辞書部724に
格納された標準音声パターンと比較することによって、
音声認識を行う。
【0009】音響モデル格納部723には、音声認識に
用いる切り出された音声区間の音響モデルが格納されて
いる。
用いる切り出された音声区間の音響モデルが格納されて
いる。
【0010】音声認識辞書部724は、RAM等からな
り、操作者の発声に応じた標準音声パターンを格納して
いる。この標準音声パターンは、操作者があらかじめ格
納しておく。
り、操作者の発声に応じた標準音声パターンを格納して
いる。この標準音声パターンは、操作者があらかじめ格
納しておく。
【0011】一方、翻訳部73の翻訳語データ用メモリ
カード731は、ROMカード等からなり、音声認識し
た単語に対応する翻訳語が格納されており、翻訳語を音
声合成して出力する場合には、音声データを格納してい
る。また、この翻訳語データ用メモリカード731か
ら、翻訳語に対応したキャラクターコードを読み込み、
表示部735に表示する。翻訳語データ用メモリカード
731を他の言語のものと交換することによって、音声
認識した単語を複数の言語に対応して翻訳することが可
能となる。
カード731は、ROMカード等からなり、音声認識し
た単語に対応する翻訳語が格納されており、翻訳語を音
声合成して出力する場合には、音声データを格納してい
る。また、この翻訳語データ用メモリカード731か
ら、翻訳語に対応したキャラクターコードを読み込み、
表示部735に表示する。翻訳語データ用メモリカード
731を他の言語のものと交換することによって、音声
認識した単語を複数の言語に対応して翻訳することが可
能となる。
【0012】音声合成部732は、音声認識処理部72
2により認識された音声に対応した翻訳語を、翻訳語デ
ータ用メモリカード731から読み込み、音声信号に変
換してスピーカアンプ733、スピーカ734を経て出
力する。
2により認識された音声に対応した翻訳語を、翻訳語デ
ータ用メモリカード731から読み込み、音声信号に変
換してスピーカアンプ733、スピーカ734を経て出
力する。
【0013】表示部735は、翻訳装置の使用者への指
示や翻訳語の文字による表示等をおこなう。
示や翻訳語の文字による表示等をおこなう。
【0014】制御部74は、マイクロプロセッサ等から
なり、音声翻訳装置7の各部を制御する。
なり、音声翻訳装置7の各部を制御する。
【0015】このような音声認識、音声合成技術の分野
は、半導体技術の向上を背景として、システムがより人
間的なユーザインタフェースを提供すべきであるという
要望から、その発展が期待されている。上記従来の音声
認識技術を用いた小型情報システムにおいても、カーナ
ビゲーションシステムをはじめとして、PDAに代表さ
れる携帯型情報機器、携帯型翻訳機、さらに、音声イン
タフェースを持った情報家電として、今後ますます普及
してくることが予想される。
は、半導体技術の向上を背景として、システムがより人
間的なユーザインタフェースを提供すべきであるという
要望から、その発展が期待されている。上記従来の音声
認識技術を用いた小型情報システムにおいても、カーナ
ビゲーションシステムをはじめとして、PDAに代表さ
れる携帯型情報機器、携帯型翻訳機、さらに、音声イン
タフェースを持った情報家電として、今後ますます普及
してくることが予想される。
【0016】そこで、このような音声認識技術を使用し
た分野での実用化における課題は、認識率の向上と認識
応答時間の短縮にある。従来の技術では、認識率や認識
応答時間の性能を低下させないためには、認識する語数
に制約を設ける必要がある。その制約の中で、あらかじ
め登録しておいた単語、文に対して、その文字列が持つ
統計的な話者の音声の特徴と、実際に話者が発声した音
声の特徴とを比較し、確率的に一番近い値を認識結果と
している。特に、雑音環境下におけるあるレベル以上の
認識率を確保するには、この手法が必要不可欠である。
た分野での実用化における課題は、認識率の向上と認識
応答時間の短縮にある。従来の技術では、認識率や認識
応答時間の性能を低下させないためには、認識する語数
に制約を設ける必要がある。その制約の中で、あらかじ
め登録しておいた単語、文に対して、その文字列が持つ
統計的な話者の音声の特徴と、実際に話者が発声した音
声の特徴とを比較し、確率的に一番近い値を認識結果と
している。特に、雑音環境下におけるあるレベル以上の
認識率を確保するには、この手法が必要不可欠である。
【0017】今後、音声認識における技術革新や、それ
を実現するソフトウエア、ハードウエアの性能向上によ
り、認識する語数に制約を設けなくとも、認識率や認識
応答時間の性能は向上することが考えられる。しかしな
がら、音声認識システムの実用的な観点から、処理量は
できるだけ小さい方が認識率や認識応答時間における音
声認識の単体性能、並びに音声認識を組み込んだシステ
ム全体の性能と使い勝手の面では好ましい。また、音声
認識を使い易いインタフェースにするための課題は、音
声認識を音声を用いた単なる一つのユーザインタフェー
スにすることである。
を実現するソフトウエア、ハードウエアの性能向上によ
り、認識する語数に制約を設けなくとも、認識率や認識
応答時間の性能は向上することが考えられる。しかしな
がら、音声認識システムの実用的な観点から、処理量は
できるだけ小さい方が認識率や認識応答時間における音
声認識の単体性能、並びに音声認識を組み込んだシステ
ム全体の性能と使い勝手の面では好ましい。また、音声
認識を使い易いインタフェースにするための課題は、音
声認識を音声を用いた単なる一つのユーザインタフェー
スにすることである。
【0018】そのためには、音声認識処理をシステム本
体で行わず、マイク等のインタフェース側で実現するこ
とである。それにより、システム本体とマイク等の音声
認識インタフェースは、既存のシステムに容易に接続可
能となる。さらに、音声認識処理した結果をシステム本
体へ転送することから、従来のアナログ音声信号をシス
テム本体へ転送してから音声認識する場合と比べて、環
境からのノイズの影響を小さくすることができる。した
がってシステム全体の認識性能を向上させることができ
る。そのためには、システム本体と、音声認識を実行す
るマイクなどのインタフェース部とを分離して使い勝手
のよいシステムを提供する必要がある。
体で行わず、マイク等のインタフェース側で実現するこ
とである。それにより、システム本体とマイク等の音声
認識インタフェースは、既存のシステムに容易に接続可
能となる。さらに、音声認識処理した結果をシステム本
体へ転送することから、従来のアナログ音声信号をシス
テム本体へ転送してから音声認識する場合と比べて、環
境からのノイズの影響を小さくすることができる。した
がってシステム全体の認識性能を向上させることができ
る。そのためには、システム本体と、音声認識を実行す
るマイクなどのインタフェース部とを分離して使い勝手
のよいシステムを提供する必要がある。
【0019】従来のカーナビゲーションシステムにおけ
る音声認識システムでは、地名、交差点名、建物名、駅
名、電話番号などの音声認識対象となる辞書を数十万単
語用意して、辞書を階層的に分割して音声認識を階層的
に実行する。目的の単語まで到達するまでに、数回の音
声を発生し、かつ音声認識するまでくり返す。目的の単
語が認識されると、例えば、目的地までのルート探索が
行われる。
る音声認識システムでは、地名、交差点名、建物名、駅
名、電話番号などの音声認識対象となる辞書を数十万単
語用意して、辞書を階層的に分割して音声認識を階層的
に実行する。目的の単語まで到達するまでに、数回の音
声を発生し、かつ音声認識するまでくり返す。目的の単
語が認識されると、例えば、目的地までのルート探索が
行われる。
【0020】このようなシステムでは、認識対象となる
辞書の語数は膨大であり、認識率や認識応答時間の性能
を低下させないために、辞書の階層化および音声認識を
階層的に実行する。これでは、一つの目的単語を認識さ
せるのに数回の音声認識を実行しなければならない。し
たがって、便利であるはずの音声認識によるインタフェ
ースが逆に不便なものとなりシステム全体の使い勝手が
悪くなってしまう。
辞書の語数は膨大であり、認識率や認識応答時間の性能
を低下させないために、辞書の階層化および音声認識を
階層的に実行する。これでは、一つの目的単語を認識さ
せるのに数回の音声認識を実行しなければならない。し
たがって、便利であるはずの音声認識によるインタフェ
ースが逆に不便なものとなりシステム全体の使い勝手が
悪くなってしまう。
【0021】また、辞書を階層的にせず、数十万単語か
らなる辞書で、はじめから目的の単語を発声する音声認
識システムでは、将来、音声認識技術の革新で認識率が
向上したとしても、特に、システムの低価格化において
は、認識率や認識応答時間の面で充分な性能が得られな
い。
らなる辞書で、はじめから目的の単語を発声する音声認
識システムでは、将来、音声認識技術の革新で認識率が
向上したとしても、特に、システムの低価格化において
は、認識率や認識応答時間の面で充分な性能が得られな
い。
【0022】さらに、辞書を階層化し数回の音声認識を
実行して、基本的な音声認識の性能が得られたとして
も、認識率は100%にはならない。それは、人間が音
的に類似した単語を聞き間違えるのと同じである。
実行して、基本的な音声認識の性能が得られたとして
も、認識率は100%にはならない。それは、人間が音
的に類似した単語を聞き間違えるのと同じである。
【0023】例えば、カーナビゲーションシステムに適
用した音声認識システムを図7を用いて説明する。図7
は、従来の音声認識システムであり、音声認識処理をカ
ーナビゲーションシステム本体側で行っているシステム
における音声認識処理の流れを説明する図である。従来
のシステムでは、音声認識に関わる一連の処理は、カー
ナビゲーションシステム本体が行っているので、カーナ
ビゲーションシステムに限らず、他に優先順位の高い処
理との競合が起こり、CPUの負荷は大きくなる。ま
た、もともと音声のインタフェースを持たないシステム
においては、CPUの負荷に加えて、ハードウエアの改
造が伴う。
用した音声認識システムを図7を用いて説明する。図7
は、従来の音声認識システムであり、音声認識処理をカ
ーナビゲーションシステム本体側で行っているシステム
における音声認識処理の流れを説明する図である。従来
のシステムでは、音声認識に関わる一連の処理は、カー
ナビゲーションシステム本体が行っているので、カーナ
ビゲーションシステムに限らず、他に優先順位の高い処
理との競合が起こり、CPUの負荷は大きくなる。ま
た、もともと音声のインタフェースを持たないシステム
においては、CPUの負荷に加えて、ハードウエアの改
造が伴う。
【0024】ここでは、第1の発生「ホテル」の後に、
第2の発生「△△△ホテル」を発した場合の音声認識処
理を説明する。このシステムでは、対象別に複数の辞書
が設けられている。第1の発声「ホテル」が入力される
(S1)と、音声認識処理P1は、一連の音声認識処理
を行って、認識結果「ホテル」を出力し、アプリケーシ
ョンP2へ送出する(S2)。認識結果「ホテル」は、
アプリケーションP2で、辞書選択処理P3を起動し
(S3)、大規模認識対象辞書53内のホテル単語辞書
531を選択する(S4)。
第2の発生「△△△ホテル」を発した場合の音声認識処
理を説明する。このシステムでは、対象別に複数の辞書
が設けられている。第1の発声「ホテル」が入力される
(S1)と、音声認識処理P1は、一連の音声認識処理
を行って、認識結果「ホテル」を出力し、アプリケーシ
ョンP2へ送出する(S2)。認識結果「ホテル」は、
アプリケーションP2で、辞書選択処理P3を起動し
(S3)、大規模認識対象辞書53内のホテル単語辞書
531を選択する(S4)。
【0025】ホテル単語辞書531は、ホテル名の単語
で構成された辞書であり、単語数は、5000単語であ
るとする。大規模認識対象辞書53として、ホテル単語
辞書の他にパーク単語辞書531、スキー場単語辞書5
32などが保存されており、単語数は、それぞれ100
00単語、4000単語であるとする。選択されたホテ
ル単語辞書531は、認識対象辞書534として以降の
音声認識処理P1に用いられる。
で構成された辞書であり、単語数は、5000単語であ
るとする。大規模認識対象辞書53として、ホテル単語
辞書の他にパーク単語辞書531、スキー場単語辞書5
32などが保存されており、単語数は、それぞれ100
00単語、4000単語であるとする。選択されたホテ
ル単語辞書531は、認識対象辞書534として以降の
音声認識処理P1に用いられる。
【0026】第2以降の発声「△△△ホテル」が入力さ
れると(S5)、音声認識所利P1は音声認識処理を行
い、認識結果「△△△ホテル」をアプリケーションP2
に出力する(S6)。アプリケーションP2は、このデ
ータを、目的地設定、ルート検索などの処理に渡す(S
7)。
れると(S5)、音声認識所利P1は音声認識処理を行
い、認識結果「△△△ホテル」をアプリケーションP2
に出力する(S6)。アプリケーションP2は、このデ
ータを、目的地設定、ルート検索などの処理に渡す(S
7)。
【0027】このような方式では、ユーザは、以上の様
な「ホテル」の入力から始まるやり取りを、目的地を設
定するごとに行わなければならない。先に述べた通り、
このような手法は、CPUの負荷と、辞書の単語数か
ら、認識応答時間と認識率の面で、特に、システムトー
タルの低価格化において認識性能を劣化させることとな
る。
な「ホテル」の入力から始まるやり取りを、目的地を設
定するごとに行わなければならない。先に述べた通り、
このような手法は、CPUの負荷と、辞書の単語数か
ら、認識応答時間と認識率の面で、特に、システムトー
タルの低価格化において認識性能を劣化させることとな
る。
【0028】
【発明が解決しようとする課題】以上の点に鑑み、本発
明の第一の目的は、音声認識を実行する音声認識インタ
フェース部を音声認識結果を利用するシステム本体と分
離して、システム本体へは認識した結果だけを転送する
音声認識マイクを提供することにある。また、本発明の
第二の目的は、性能の面から見ても使い勝手の良い音声
認識マイクを提供することである。
明の第一の目的は、音声認識を実行する音声認識インタ
フェース部を音声認識結果を利用するシステム本体と分
離して、システム本体へは認識した結果だけを転送する
音声認識マイクを提供することにある。また、本発明の
第二の目的は、性能の面から見ても使い勝手の良い音声
認識マイクを提供することである。
【0029】すなわち、例えば、カーナビゲーションシ
ステムに登録されている膨大な辞書の中で、ユーザがよ
く使う複数の辞書の単語数は、コマンドや目的地の地名
など合計しても100単語以下であると想定する。そこ
で、音声認識マイクの認識対象単語は、ユーザが、シス
テム本体側の膨大な辞書から必要な単語だけを、システ
ム本体側から音声認識マイク側へ登録した単語に限って
音声認識処理を実行する。したがって、認識率は100
%に近くなり、また処理量も小さくなることから、低価
格なハードウエアでも十分な性能が実現できる。
ステムに登録されている膨大な辞書の中で、ユーザがよ
く使う複数の辞書の単語数は、コマンドや目的地の地名
など合計しても100単語以下であると想定する。そこ
で、音声認識マイクの認識対象単語は、ユーザが、シス
テム本体側の膨大な辞書から必要な単語だけを、システ
ム本体側から音声認識マイク側へ登録した単語に限って
音声認識処理を実行する。したがって、認識率は100
%に近くなり、また処理量も小さくなることから、低価
格なハードウエアでも十分な性能が実現できる。
【0030】
【課題を解決するための手段】上記目的を達成するため
に、請求項1の発明は、音声認識の対象となる単語や文
章を集めて辞書として定義し、音声認識結果に基づいて
それらの単語や文章を取り出して、後続する情報処理用
データや文字列表示や単語が示す画像などとして出力し
たり、認識結果を音声合成を用いて音声として出力する
音声認識システムにける音声認識機能を備えた音声認識
マイクにおいて、マイク単体の機能を有するマイク部
と、マイク部からのアナログ信号をデジタル信号に変換
するA/D変換器と、音声区間を検出する音声区間検出
処理と、取り込んだ音声に対して音声分析する音声分析
処理と、音声の特徴を音素単位でもつ音響モデルと、あ
らかじめ登録された辞書と音響モデルを連結して、音響
モデルと連結された全ての辞書において、入力された音
声の音声分析結果と照合し、確からしい認識結果を出力
する音声認識処理部を備えて構成し、マイクから音声認
識結果を出力するようにした。
に、請求項1の発明は、音声認識の対象となる単語や文
章を集めて辞書として定義し、音声認識結果に基づいて
それらの単語や文章を取り出して、後続する情報処理用
データや文字列表示や単語が示す画像などとして出力し
たり、認識結果を音声合成を用いて音声として出力する
音声認識システムにける音声認識機能を備えた音声認識
マイクにおいて、マイク単体の機能を有するマイク部
と、マイク部からのアナログ信号をデジタル信号に変換
するA/D変換器と、音声区間を検出する音声区間検出
処理と、取り込んだ音声に対して音声分析する音声分析
処理と、音声の特徴を音素単位でもつ音響モデルと、あ
らかじめ登録された辞書と音響モデルを連結して、音響
モデルと連結された全ての辞書において、入力された音
声の音声分析結果と照合し、確からしい認識結果を出力
する音声認識処理部を備えて構成し、マイクから音声認
識結果を出力するようにした。
【0031】請求項2の発明は請求項1の音声認識マイ
クにおいて、音声の入力から音声認識結果を出力するま
での一連の音声認識処理を行う音声認識部と、音声認識
結果を用いて新たな処理を実行するシステム本体へ認識
結果を転送しシステム本体から認識対象データを転送す
るデータ通信部と、認識対象となる辞書を含む辞書部を
有して構成した。
クにおいて、音声の入力から音声認識結果を出力するま
での一連の音声認識処理を行う音声認識部と、音声認識
結果を用いて新たな処理を実行するシステム本体へ認識
結果を転送しシステム本体から認識対象データを転送す
るデータ通信部と、認識対象となる辞書を含む辞書部を
有して構成した。
【0032】請求項3の発明は、請求項2の音声認識マ
イクにおいて、データ通信部を、音声認識マイクとシス
テム本体を有線または無線もしくは赤外線通信で接続す
るインタフェースとして構成し、通信されるデータをデ
ジタルデータとし、その内容を、音声認識結果を表すテ
キストデータおよび/またはデジタル化された音声波形
データおよび/または音声でない雑音Nと音声Sのレベ
ルを示すS/N比のデータとした。
イクにおいて、データ通信部を、音声認識マイクとシス
テム本体を有線または無線もしくは赤外線通信で接続す
るインタフェースとして構成し、通信されるデータをデ
ジタルデータとし、その内容を、音声認識結果を表すテ
キストデータおよび/またはデジタル化された音声波形
データおよび/または音声でない雑音Nと音声Sのレベ
ルを示すS/N比のデータとした。
【0033】請求項4の発明は、上記音声認識マイクに
おいて、これから音声を入力することを音声認識マイク
に知らせるための音声入力通知手段を接続するためのイ
ンタフェースを備えた。
おいて、これから音声を入力することを音声認識マイク
に知らせるための音声入力通知手段を接続するためのイ
ンタフェースを備えた。
【0034】請求項5の発明は、上記音声認識マイクに
おいて、あらかじめ音声認識マイクに登録したコマンド
辞書と、システム本体の記憶媒体に登録された大規模な
辞書から認識対象となる辞書を読み出した認識対象辞書
と、ユーザの登録処理によって作成されるユーザ登録辞
書とを有して構成した。
おいて、あらかじめ音声認識マイクに登録したコマンド
辞書と、システム本体の記憶媒体に登録された大規模な
辞書から認識対象となる辞書を読み出した認識対象辞書
と、ユーザの登録処理によって作成されるユーザ登録辞
書とを有して構成した。
【0035】請求項6の発明は、音声認識機能を有し入
力された音声を認識した結果を出力する音声認識マイク
と、音声認識結果を用いて後続する処理を実行する情報
処理手段とから音声認識システムを構築した。
力された音声を認識した結果を出力する音声認識マイク
と、音声認識結果を用いて後続する処理を実行する情報
処理手段とから音声認識システムを構築した。
【0036】請求項7の発明は、上記音声認識システム
において、上記音声認識マイクが音声認識処理部と辞書
部とデータ通信部を有し、上記情報処理手段が音声認識
に使用する認識対象辞書とデータ通信部を有し、前記音
声認識マイクでの音声認識結果に基づいて音声認識マイ
クの辞書部に前記情報処理手段の認識対象辞書の一部分
を転送し、転送された認識対象辞書を用いて音声認識す
るようにした。
において、上記音声認識マイクが音声認識処理部と辞書
部とデータ通信部を有し、上記情報処理手段が音声認識
に使用する認識対象辞書とデータ通信部を有し、前記音
声認識マイクでの音声認識結果に基づいて音声認識マイ
クの辞書部に前記情報処理手段の認識対象辞書の一部分
を転送し、転送された認識対象辞書を用いて音声認識す
るようにした。
【0037】請求項8の発明は、上記音声認識システム
において、上記音声認識マイクの辞書部にユーザ登録辞
書を設け、該ユーザ辞書に認識対象辞書の中のユーザが
必要とする単語を登録し、通常の音声認識では、コマン
ド辞書とユーザ登録辞書を認識対象として音声認識する
ようにした。
において、上記音声認識マイクの辞書部にユーザ登録辞
書を設け、該ユーザ辞書に認識対象辞書の中のユーザが
必要とする単語を登録し、通常の音声認識では、コマン
ド辞書とユーザ登録辞書を認識対象として音声認識する
ようにした。
【0038】請求項9の発明は、音声認識処理部と辞書
部とデータ通信部を有する音声認識マイクと、音声認識
結果に基づいて処理を行う情報処理手段とからなる音声
認識システムの音声認識方法において、音声認識マイク
の辞書部に、コマンド辞書と、情報処理手段から転送さ
れた認識対象辞書と、ユーザ登録辞書とを備え、認識対
象辞書の中から最終的にユーザが必要とする複数の単語
を集めてユーザ登録辞書を作成し、通常の音声認識では
コマンド辞書とユーザ登録辞書を認識対象として音声認
識するようにした。
部とデータ通信部を有する音声認識マイクと、音声認識
結果に基づいて処理を行う情報処理手段とからなる音声
認識システムの音声認識方法において、音声認識マイク
の辞書部に、コマンド辞書と、情報処理手段から転送さ
れた認識対象辞書と、ユーザ登録辞書とを備え、認識対
象辞書の中から最終的にユーザが必要とする複数の単語
を集めてユーザ登録辞書を作成し、通常の音声認識では
コマンド辞書とユーザ登録辞書を認識対象として音声認
識するようにした。
【0039】
【発明の実施の形態】以下、本発明に係る各実施形態
を、図1から図5を用いて説明する。図1は、本発明に
かかる音声認識マイクの機能構成を示すブロック図であ
る。
を、図1から図5を用いて説明する。図1は、本発明に
かかる音声認識マイクの機能構成を示すブロック図であ
る。
【0040】図1に示す音声認識マイク1は、音声認識
した結果3を出力する。この音声認識マイク1の出力3
は、音声認識した結果に限らず、音声認識に関わる情報
であってよい。例えば、本来のマイクの基本機能である
音声や周囲の音を集音して、従来はアナログ信号として
伝達していたものをデジタル化して出力したデジタル波
形信号である。また、音声でない雑音Nのレベルと、音
声Sのレベルを相対的な比で表したS/N比のデータで
ある。これらのデジタル化された情報は、音声認識マイ
クとシステム本体を組み合わせて新たなシステムを構築
する場合のアプリケーションに必要な基本情報である。
した結果3を出力する。この音声認識マイク1の出力3
は、音声認識した結果に限らず、音声認識に関わる情報
であってよい。例えば、本来のマイクの基本機能である
音声や周囲の音を集音して、従来はアナログ信号として
伝達していたものをデジタル化して出力したデジタル波
形信号である。また、音声でない雑音Nのレベルと、音
声Sのレベルを相対的な比で表したS/N比のデータで
ある。これらのデジタル化された情報は、音声認識マイ
クとシステム本体を組み合わせて新たなシステムを構築
する場合のアプリケーションに必要な基本情報である。
【0041】音声認識マイク1は、マイク11と、音声
認識部13と、辞書部15と、データ通信部17との機
能ブロックで構成される。
認識部13と、辞書部15と、データ通信部17との機
能ブロックで構成される。
【0042】マイク11は、音声や雑音を取り込むもの
で、従来から有るコンデンサマイクなどで構成され、指
向性を有している。
で、従来から有るコンデンサマイクなどで構成され、指
向性を有している。
【0043】音声認識部13は、入力された音声や雑音
から音声だけを検出して、音声分析を行う。さらに、音
声認識部13は、あらかじめ登録された辞書と、音声の
特徴を音素単位でもつ音響モデルから、登録された全て
の辞書と音響モデルを連結して、実際に入力された音声
の音声分析結果と照合して、確からしい認識結果を出力
する。
から音声だけを検出して、音声分析を行う。さらに、音
声認識部13は、あらかじめ登録された辞書と、音声の
特徴を音素単位でもつ音響モデルから、登録された全て
の辞書と音響モデルを連結して、実際に入力された音声
の音声分析結果と照合して、確からしい認識結果を出力
する。
【0044】辞書部15は、音声認識の対象となる辞書
が格納される。辞書部15に格納される辞書には、あら
かじめ音声認識マイク1に登録しておくコマンド辞書
と、システム本体の記憶媒体に登録されている大規模な
認識辞書から転送された認識対象辞書と、コマンド辞書
や認識対象辞書からユーザが必要とする単語のみ取り出
して登録して構成するユーザ登録辞書がある。辞書部1
5は、音声認識結果、コマンド辞書に登録された「ユー
ザ辞書へ登録(辞書へ登録)」を受けて、ユーザ登録辞
書を作成する。
が格納される。辞書部15に格納される辞書には、あら
かじめ音声認識マイク1に登録しておくコマンド辞書
と、システム本体の記憶媒体に登録されている大規模な
認識辞書から転送された認識対象辞書と、コマンド辞書
や認識対象辞書からユーザが必要とする単語のみ取り出
して登録して構成するユーザ登録辞書がある。辞書部1
5は、音声認識結果、コマンド辞書に登録された「ユー
ザ辞書へ登録(辞書へ登録)」を受けて、ユーザ登録辞
書を作成する。
【0045】データ通信部17は、音声認識部の音声認
識結果を、音声認識マイク1が接続されたシステム本体
あるいは音声認識マイク1を使用しているシステム本体
に、転送するための処理を行う。また、音声認識結果と
同様に、デジタル化された音声信号や、音声に関わる情
報を転送する。
識結果を、音声認識マイク1が接続されたシステム本体
あるいは音声認識マイク1を使用しているシステム本体
に、転送するための処理を行う。また、音声認識結果と
同様に、デジタル化された音声信号や、音声に関わる情
報を転送する。
【0046】図2を用いて、音声認識マイク1のハード
ウエア構成を説明する。音声認識マイク1は、マイク1
1と、アンプ21と、A/D変換器22と、CPU23
と、ROM24と、RAM25と、有線インタフェース
26−1と、赤外線インタフェース(IR)26−2
と、無線インタフェース26−3と、音声認識モードイ
ンタフェース26−4と、これらを相互に接続するシス
テムバス27と、音声入力ボタン29とを有して構成さ
れる。
ウエア構成を説明する。音声認識マイク1は、マイク1
1と、アンプ21と、A/D変換器22と、CPU23
と、ROM24と、RAM25と、有線インタフェース
26−1と、赤外線インタフェース(IR)26−2
と、無線インタフェース26−3と、音声認識モードイ
ンタフェース26−4と、これらを相互に接続するシス
テムバス27と、音声入力ボタン29とを有して構成さ
れる。
【0047】マイク11は、図1に示したマイク11と
同じである。
同じである。
【0048】アンプ21は、抵抗、コンデンサなどの電
子部品で構成されたアンプであり、雑音を除去するため
のハイパスフィルタや、バンドパスフィルタを含んでい
る。
子部品で構成されたアンプであり、雑音を除去するため
のハイパスフィルタや、バンドパスフィルタを含んでい
る。
【0049】A/D変換器22は、アンプ21を経由し
てマイク11から入力された音声や雑音のアナログ信号
をデジタル信号に変換する。A/D変換器22は、シス
テムバス27に接続されている。
てマイク11から入力された音声や雑音のアナログ信号
をデジタル信号に変換する。A/D変換器22は、シス
テムバス27に接続されている。
【0050】CPU23は、音声認識マイク1におい
て、音声認識および辞書登録ならびにデータ通信の全て
の処理をソフトウエアで行う中央処理ユニットあるいは
CPUコアである。
て、音声認識および辞書登録ならびにデータ通信の全て
の処理をソフトウエアで行う中央処理ユニットあるいは
CPUコアである。
【0051】ROM24には、音声認識マイクシステム
の初期化および一連の音声認識および辞書登録ならびに
データ通信の全ての処理をソフトウエアで実行するため
のプログラムが、書き込まれている。また、ROM24
には、音声認識に必要な音響モデルや辞書、文法なども
書き込まれている。
の初期化および一連の音声認識および辞書登録ならびに
データ通信の全ての処理をソフトウエアで実行するため
のプログラムが、書き込まれている。また、ROM24
には、音声認識に必要な音響モデルや辞書、文法なども
書き込まれている。
【0052】RAM25は、一連の音声認識、辞書登
録、データ通信の全ての処理をソフトウエアで実行する
ためのプログラムをアクセスの高速なメモリに転送して
実行するためのメモリであり、また、プログラム実行中
に必要なワークエリアを確保するためのメモリである。
さらに、電源を切ってもユーザの登録した辞書などが消
えない様にするためのメモリである。
録、データ通信の全ての処理をソフトウエアで実行する
ためのプログラムをアクセスの高速なメモリに転送して
実行するためのメモリであり、また、プログラム実行中
に必要なワークエリアを確保するためのメモリである。
さらに、電源を切ってもユーザの登録した辞書などが消
えない様にするためのメモリである。
【0053】有線インタフェース26−1は、音声認識
マイク1と接続されたシステム本体の間で情報(データ
31)をやり取りするためのインタフェースである。シ
ステム本体とは、有線で接続され、データビット幅は、
シリアルでもパラレルでもよい。
マイク1と接続されたシステム本体の間で情報(データ
31)をやり取りするためのインタフェースである。シ
ステム本体とは、有線で接続され、データビット幅は、
シリアルでもパラレルでもよい。
【0054】データ31は、音声認識マイク1とシステ
ム本体の間で、有線を介して双方向に転送されるデータ
である。その第1は、音声認識マイク1から出力される
認識結果である。認識結果は、テキストデータの文字情
報であっても、コード化されたデータもよい。第2は、
認識対象となる辞書データである。辞書データは、シス
テム本体から音声認識マイク1へ転送される。第3は、
音声でない雑音Nと音声Sのレベルを示すS/N比のデ
ータである。第4は、システム本体で音声認識モードに
入っていることを伝えるための情報である。例えば、シ
ステム本体側のカーナビゲーションシステムにおいて、
音声認識モードとしてリモコンの発話ボタンが押された
場合などである。そこで、音声認識マイク1は、入力さ
れた音声に対して、音声認識処理を実行する。
ム本体の間で、有線を介して双方向に転送されるデータ
である。その第1は、音声認識マイク1から出力される
認識結果である。認識結果は、テキストデータの文字情
報であっても、コード化されたデータもよい。第2は、
認識対象となる辞書データである。辞書データは、シス
テム本体から音声認識マイク1へ転送される。第3は、
音声でない雑音Nと音声Sのレベルを示すS/N比のデ
ータである。第4は、システム本体で音声認識モードに
入っていることを伝えるための情報である。例えば、シ
ステム本体側のカーナビゲーションシステムにおいて、
音声認識モードとしてリモコンの発話ボタンが押された
場合などである。そこで、音声認識マイク1は、入力さ
れた音声に対して、音声認識処理を実行する。
【0055】赤外線インタフェース26−2は、音声認
識マイク1と接続されたシステム本体の間で情報(デー
タ32)をやり取りするためのインタフェースである。
システム本体とは、赤外線IRを使った無線でインタフ
ェースされ、データビット幅は、シリアルでもパラレル
でもよい。
識マイク1と接続されたシステム本体の間で情報(デー
タ32)をやり取りするためのインタフェースである。
システム本体とは、赤外線IRを使った無線でインタフ
ェースされ、データビット幅は、シリアルでもパラレル
でもよい。
【0056】データ32は、音声認識マイク1とシステ
ム本体の間で、赤外線通信方式を介して双方向に転送さ
れるデータである。その内容はデータ31と同じであ
る。
ム本体の間で、赤外線通信方式を介して双方向に転送さ
れるデータである。その内容はデータ31と同じであ
る。
【0057】無線インタフェース26−3は、音声認識
マイク1と接続されたシステム本体の間で情報(データ
33)をやり取りするためのインタフェースである。シ
ステム本体とは、無線LANなどを使った無線でインタ
フェースされ、データビット幅は、シリアルでもパラレ
ルでもよい。
マイク1と接続されたシステム本体の間で情報(データ
33)をやり取りするためのインタフェースである。シ
ステム本体とは、無線LANなどを使った無線でインタ
フェースされ、データビット幅は、シリアルでもパラレ
ルでもよい。
【0058】データ33は、音声認識マイク1とシステ
ム本体の間で、無線を介して双方向に転送されるデータ
である。その内容はデータ31と同様である。
ム本体の間で、無線を介して双方向に転送されるデータ
である。その内容はデータ31と同様である。
【0059】ここで、システム本体とのインタフェース
をとる有線インタフェース26−1、赤外線インタフェ
ース26−2、無線インタフェース26−3は、音声認
識マイク1において、どれか1つだけのインタフェース
をそなえていてもよいし、全てのインタフェースを備え
ていてもよい。
をとる有線インタフェース26−1、赤外線インタフェ
ース26−2、無線インタフェース26−3は、音声認
識マイク1において、どれか1つだけのインタフェース
をそなえていてもよいし、全てのインタフェースを備え
ていてもよい。
【0060】音声認識モードインタフェース26−4
は、上記システム本体で音声認識モードに入っているこ
とを伝えるための情報において、直接に音声認識マイク
1に音声認識モードに入っていることを伝えるためのイ
ンタフェースである。音声認識モードインタフェース2
6−4には、音声入力状態を通知する音声入力ボタン2
9が接続されている。直接に音声認識マイク1に音声認
識モードに入っていることを伝えるための意味は、例え
ば、システム本体は、音声認識マイク1からの認識結果
31〜33を一方向的に受けて、システム本体が別のあ
る処理や仕事をする場合などに有効である。このような
手法が必要な場合は、音声リモコンに適応した場合が考
えられる。
は、上記システム本体で音声認識モードに入っているこ
とを伝えるための情報において、直接に音声認識マイク
1に音声認識モードに入っていることを伝えるためのイ
ンタフェースである。音声認識モードインタフェース2
6−4には、音声入力状態を通知する音声入力ボタン2
9が接続されている。直接に音声認識マイク1に音声認
識モードに入っていることを伝えるための意味は、例え
ば、システム本体は、音声認識マイク1からの認識結果
31〜33を一方向的に受けて、システム本体が別のあ
る処理や仕事をする場合などに有効である。このような
手法が必要な場合は、音声リモコンに適応した場合が考
えられる。
【0061】音声認識マイク1は、複数のLSIやIC
で構成してもよいし、ASIC等の一つの半導体素子上
に構成してもよい。ASICであれば、CPU23はC
PUコアとして構成される。
で構成してもよいし、ASIC等の一つの半導体素子上
に構成してもよい。ASICであれば、CPU23はC
PUコアとして構成される。
【0062】図3を用いて、音声認識マイク1と音声認
識の結果を用いて動作するシステム本体5を、無線ある
いは有線で接続し、音声認識をインタフェースに持つシ
ステム構成と、処理の流れを説明する。例えば、本願に
おけるシステムの一例として、カーナビゲーションシス
テムがあげられる。
識の結果を用いて動作するシステム本体5を、無線ある
いは有線で接続し、音声認識をインタフェースに持つシ
ステム構成と、処理の流れを説明する。例えば、本願に
おけるシステムの一例として、カーナビゲーションシス
テムがあげられる。
【0063】このシステムは、音声認識マイク1とシス
テム本体5を、無線あるいは有線4などの通信方式で接
続して構成される。
テム本体5を、無線あるいは有線4などの通信方式で接
続して構成される。
【0064】音声認識マイク1は、例えば、カーナビゲ
ーションシステムにおいては、車内のサンバイザー、シ
ートベルト、ステアリングコラム、ピラーやハンドルに
設置されるか内蔵される。または、音声認識マイク1
は、システムをコントロールするリモコンに内蔵され
る。
ーションシステムにおいては、車内のサンバイザー、シ
ートベルト、ステアリングコラム、ピラーやハンドルに
設置されるか内蔵される。または、音声認識マイク1
は、システムをコントロールするリモコンに内蔵され
る。
【0065】カーナビゲーションシステム本体5は、オ
ーディオシステムや空調システムと一体化され、ディス
プレイも含めて車内に搭載される。
ーディオシステムや空調システムと一体化され、ディス
プレイも含めて車内に搭載される。
【0066】音声認識マイク1は、マイク11と、音声
認識部13と、辞書部15と、データ通信部17と、音
声入力ボタン29とを有して構成される。
認識部13と、辞書部15と、データ通信部17と、音
声入力ボタン29とを有して構成される。
【0067】音声認識部13は、A/D変換器131
と、音声区間切出部132と、音声分析処理部133
と、音声認識処理部134と、音響モデル格納部135
とを有して構成される。
と、音声区間切出部132と、音声分析処理部133
と、音声認識処理部134と、音響モデル格納部135
とを有して構成される。
【0068】辞書部15は、コマンド辞書151と、認
識対象辞書152と、辞書登録処理部153と、ユーザ
登録辞書154を有して構成される。
識対象辞書152と、辞書登録処理部153と、ユーザ
登録辞書154を有して構成される。
【0069】データ通信部17は、音声認識処理部13
4によって認識された結果をシステム本体5に転送する
処理を行うデータ通信部である。あるいは、システム本
体5から転送されてくる認識対象の辞書データや音声認
識モードに入ったことを伝えるための情報を受け取る。
4によって認識された結果をシステム本体5に転送する
処理を行うデータ通信部である。あるいは、システム本
体5から転送されてくる認識対象の辞書データや音声認
識モードに入ったことを伝えるための情報を受け取る。
【0070】システム本体5は、例えば、カーナビゲー
ションシステムとして構成される。この場合、システム
本体5は、データ通信部51と、辞書読出部52と、認
識対象大規模辞書53と、アプリケーションソフト54
と、音声合成部55と、表示部56とを有して構成され
る。
ションシステムとして構成される。この場合、システム
本体5は、データ通信部51と、辞書読出部52と、認
識対象大規模辞書53と、アプリケーションソフト54
と、音声合成部55と、表示部56とを有して構成され
る。
【0071】A/D変換器131は、マイク11から出
力されたアナログ信号をディジタル信号に変換して、音
声区間切出部133に出力する。
力されたアナログ信号をディジタル信号に変換して、音
声区間切出部133に出力する。
【0072】音声区間切出部132は、ディジタル信号
に変換された音声や雑音を含む入力信号から音声を切り
出して、音声分析処理部133へ出力する。
に変換された音声や雑音を含む入力信号から音声を切り
出して、音声分析処理部133へ出力する。
【0073】音声分析処理部133は、音声を分析して
分析結果を音声認識処理部134へ出力する。
分析結果を音声認識処理部134へ出力する。
【0074】音声認識処理部134は、音声分析結果と
音響モデルと辞書を用いて、確率的に音声照合の一連の
処理を行い、確からしい認識結果を出力する音声認識部
である。
音響モデルと辞書を用いて、確率的に音声照合の一連の
処理を行い、確からしい認識結果を出力する音声認識部
である。
【0075】音響モデル格納部135には、音声認識に
必要な音響モデルが格納される。実用化されつつある一
般的な音声認識システムでは、あらかじめ声を登録しな
くても、誰が話し手でもその声を認識できるいわゆる
「不特定話者対応」が主流になっている。このような音
声認識に用いられる音響モデルとしては、例えば、隠れ
マルコフモデル(HMM:Hidden Markov Model)を用いる
ことができる。
必要な音響モデルが格納される。実用化されつつある一
般的な音声認識システムでは、あらかじめ声を登録しな
くても、誰が話し手でもその声を認識できるいわゆる
「不特定話者対応」が主流になっている。このような音
声認識に用いられる音響モデルとしては、例えば、隠れ
マルコフモデル(HMM:Hidden Markov Model)を用いる
ことができる。
【0076】コマンド辞書151は、あらかじめ音声認
識マイク1に登録されている辞書で、音声認識処理を実
行するジャンルや、音声認識処理の命令などの単語が記
述されている。
識マイク1に登録されている辞書で、音声認識処理を実
行するジャンルや、音声認識処理の命令などの単語が記
述されている。
【0077】認識対象辞書152は、音声認識の対象と
なる辞書であり、システム本体5から必要に応じて、転
送されてくる。
なる辞書であり、システム本体5から必要に応じて、転
送されてくる。
【0078】辞書登録処理部153は、認識対象となっ
ている認識対象辞書152の中から、常に音声認識マイ
ク1の中に登録しておきたい単語に対して、ユーザがコ
マンド辞書151の「辞書へ登録」を音声入力して、認
識結果として「辞書へ登録」が音声認識処理部134か
ら出力された場合に登録を行う処理部である。
ている認識対象辞書152の中から、常に音声認識マイ
ク1の中に登録しておきたい単語に対して、ユーザがコ
マンド辞書151の「辞書へ登録」を音声入力して、認
識結果として「辞書へ登録」が音声認識処理部134か
ら出力された場合に登録を行う処理部である。
【0079】ユーザ登録辞書154は、常に音声認識マ
イク1の中に登録しておきたい単語を登録する辞書であ
る。
イク1の中に登録しておきたい単語を登録する辞書であ
る。
【0080】図4を用いて、図3に示した辞書の構成に
ついて説明する。あらかじめ音声認識マイク1に登録さ
れたコマンド辞書151は、例えば300語の単語数か
らなる辞書として構成され、図4(a)に示すデータD
151として例示される。この例では、コマンド辞書1
51は、認識対象ジャンルを表す「ホテル」,「パー
ク」,「スキー場」,「ゴルフ場」を始め、処理の命令
を表す「辞書へ登録」,「辞書から削除」,「辞書の内
容」などの単語で構成されている。
ついて説明する。あらかじめ音声認識マイク1に登録さ
れたコマンド辞書151は、例えば300語の単語数か
らなる辞書として構成され、図4(a)に示すデータD
151として例示される。この例では、コマンド辞書1
51は、認識対象ジャンルを表す「ホテル」,「パー
ク」,「スキー場」,「ゴルフ場」を始め、処理の命令
を表す「辞書へ登録」,「辞書から削除」,「辞書の内
容」などの単語で構成されている。
【0081】音声認識対象辞書152は、音声認識の対
象となる辞書であり、システム本体5の認識対象大規模
辞書53から、必要に応じて転送されてくる。音声認識
マイク1は、コマンド辞書151と、この認識対象辞書
152の単語の範囲に限り、入力音声に対して音声認識
処理を行う。
象となる辞書であり、システム本体5の認識対象大規模
辞書53から、必要に応じて転送されてくる。音声認識
マイク1は、コマンド辞書151と、この認識対象辞書
152の単語の範囲に限り、入力音声に対して音声認識
処理を行う。
【0082】認識対象辞書152は、5000語ぐらい
の単語数からなり、コマンド辞書のジャンルを指定する
コマンドに対応した単語からなる辞書として構成され
る。例えば、ジャンルを指定するコマンド「ホテル」に
対応して、図4(b)のデータD152として例示した
ように、「○○○ホテル」,「△△△ホテル」,「ホテ
ル□□□□」,「◇◇◇◇旅館」…「××××ホテ
ル」,「☆☆☆ホテル」などのホテル名を表す単語のみ
が登録されている。
の単語数からなり、コマンド辞書のジャンルを指定する
コマンドに対応した単語からなる辞書として構成され
る。例えば、ジャンルを指定するコマンド「ホテル」に
対応して、図4(b)のデータD152として例示した
ように、「○○○ホテル」,「△△△ホテル」,「ホテ
ル□□□□」,「◇◇◇◇旅館」…「××××ホテ
ル」,「☆☆☆ホテル」などのホテル名を表す単語のみ
が登録されている。
【0083】ユーザ登録辞書データD154は、ユーザ
登録辞書154の具体的な内容の一例を示している。例
えば、ユーザが登録しておきたい単語で構成されてお
り、ユーザ登録辞書154を構成している単語の数は、
100単語ぐらいとする。
登録辞書154の具体的な内容の一例を示している。例
えば、ユーザが登録しておきたい単語で構成されてお
り、ユーザ登録辞書154を構成している単語の数は、
100単語ぐらいとする。
【0084】ユーザ登録辞書154は、100語程度の
単語数からなる辞書として構成される。ユーザ登録辞書
154は、ユーザが登録しておきたい単語を、コマンド
辞書151や認識対象辞書152から取り出して登録し
た辞書として構成され、図4(c)のデータD154と
して例示した、「△△△ホテル」,「東京○○○ラン
ド」,…「自宅へ戻る」など、場所や処理の命令などの
単語が登録されている。
単語数からなる辞書として構成される。ユーザ登録辞書
154は、ユーザが登録しておきたい単語を、コマンド
辞書151や認識対象辞書152から取り出して登録し
た辞書として構成され、図4(c)のデータD154と
して例示した、「△△△ホテル」,「東京○○○ラン
ド」,…「自宅へ戻る」など、場所や処理の命令などの
単語が登録されている。
【0085】つぎに、システム本体5側の処理について
説明する。システム本体5のデータ通信部51は、音声
認識マイク1によって認識された結果をシステム本体5
で受け取るためのデータ通信部である。あるいは、シス
テム本体5から音声認識マイク1に対して、認識対象の
辞書データや音声認識モードに入ったことを伝えるため
の情報を転送する。
説明する。システム本体5のデータ通信部51は、音声
認識マイク1によって認識された結果をシステム本体5
で受け取るためのデータ通信部である。あるいは、シス
テム本体5から音声認識マイク1に対して、認識対象の
辞書データや音声認識モードに入ったことを伝えるため
の情報を転送する。
【0086】辞書読出部52は、CD−ROMやDVD
に代表される大記憶容量の記憶媒体に保存されている認
識対象大規模辞書53の中から、認識対象の辞書として
分類されている辞書を読み出し、データ通信部51か
ら、音声認識マイク1へ転送する。
に代表される大記憶容量の記憶媒体に保存されている認
識対象大規模辞書53の中から、認識対象の辞書として
分類されている辞書を読み出し、データ通信部51か
ら、音声認識マイク1へ転送する。
【0087】認識対象大規模辞書53は、認識対象の辞
書が各項目ごとに分類されてCD−ROMやDVDに保
存されている。例えば、ホテル単語辞書531は、ホテ
ル名の単語で構成された辞書であり、単語数は、500
0単語であるとする。認識対象辞書として、ホテル単語
辞書の他にパーク単語辞書532、スキー場単語辞書5
33などの各種の認識対象ジャンルが保存されており、
単語数は、それぞれ10000単語、4000単語であ
るとする。
書が各項目ごとに分類されてCD−ROMやDVDに保
存されている。例えば、ホテル単語辞書531は、ホテ
ル名の単語で構成された辞書であり、単語数は、500
0単語であるとする。認識対象辞書として、ホテル単語
辞書の他にパーク単語辞書532、スキー場単語辞書5
33などの各種の認識対象ジャンルが保存されており、
単語数は、それぞれ10000単語、4000単語であ
るとする。
【0088】アプリケーションソフト54は、カーナビ
ゲーションシステムの主な処理を行うアプリケーション
ソフトであり、GPSの処理やナビゲーションの処理や
音声インタフェースなどのシステム全般にわたる処理を
行う。
ゲーションシステムの主な処理を行うアプリケーション
ソフトであり、GPSの処理やナビゲーションの処理や
音声インタフェースなどのシステム全般にわたる処理を
行う。
【0089】表示部56は、液晶表示装置(LCD)な
どから構成され、地図や進行状況、音声認識結果に対す
る情報などを表示する。
どから構成され、地図や進行状況、音声認識結果に対す
る情報などを表示する。
【0090】音声合成部55は、進行状況や音声認識結
果のコールバック、音声案内等を音声合成して処理す
る。
果のコールバック、音声案内等を音声合成して処理す
る。
【0091】図5を用いて、音声認識マイク1とシステ
ム本体5内での音声認識処理を説明する。本発明の音声
認識システムは、図7に示した従来の音声認識システム
に対して、音声認識処理を音声認識マイク1側で行うの
で、カーナビゲーションシステムに限らず、システム本
体5での処理は既存のままでよく、システム側のCPU
の負荷は変らない。また、もともと音声のインタフェー
スを持たないシステムにおいても、システム本体のCP
Uの負荷は変らない上、ハードウエアの改造も小さな変
更ですみ、通信インタフェースを持っているシステムに
おいては、音声インタフェースを持たない既存のハード
ウエアで、音声による操作を実現できる。
ム本体5内での音声認識処理を説明する。本発明の音声
認識システムは、図7に示した従来の音声認識システム
に対して、音声認識処理を音声認識マイク1側で行うの
で、カーナビゲーションシステムに限らず、システム本
体5での処理は既存のままでよく、システム側のCPU
の負荷は変らない。また、もともと音声のインタフェー
スを持たないシステムにおいても、システム本体のCP
Uの負荷は変らない上、ハードウエアの改造も小さな変
更ですみ、通信インタフェースを持っているシステムに
おいては、音声インタフェースを持たない既存のハード
ウエアで、音声による操作を実現できる。
【0092】図5において、破線から上は音声認識マイ
ク1における辞書の登録処理と音声認識処理とこの処理
に用いる辞書を、破線から下はシステム本体5における
音声認識結果の利用と辞書を示している。音声認識マイ
ク1側は、一連の音声認識を行う。この処理には、辞書
登録前に実施するユーザ登録辞書作成処理と、ユーザ登
録辞書を用いた音声認識処理を行う。
ク1における辞書の登録処理と音声認識処理とこの処理
に用いる辞書を、破線から下はシステム本体5における
音声認識結果の利用と辞書を示している。音声認識マイ
ク1側は、一連の音声認識を行う。この処理には、辞書
登録前に実施するユーザ登録辞書作成処理と、ユーザ登
録辞書を用いた音声認識処理を行う。
【0093】まず、登録前に第1の発生「ホテル」が入
力される(S11)と、コマンド辞書151を用いて音
声認識処理P11を実行し、音声認識結果「ホテル」を
出力する(S12)。認識結果「ホテル」は、システム
本体5側へ転送され、システム本体側のアプリケーショ
ン54で、辞書選択処理P52を起動し(S13)、認
識対象を網羅した認識対象大規模辞書53の内のホテル
単語辞書531を選択する。
力される(S11)と、コマンド辞書151を用いて音
声認識処理P11を実行し、音声認識結果「ホテル」を
出力する(S12)。認識結果「ホテル」は、システム
本体5側へ転送され、システム本体側のアプリケーショ
ン54で、辞書選択処理P52を起動し(S13)、認
識対象を網羅した認識対象大規模辞書53の内のホテル
単語辞書531を選択する。
【0094】選択されたホテル単語辞書531は、シス
テム本体5から、音声認識マイク1側へ転送され、認識
対象辞書152に格納される(S14)。
テム本体5から、音声認識マイク1側へ転送され、認識
対象辞書152に格納される(S14)。
【0095】第2以降の発声「△△△ホテル」が入力さ
れると(S15)、認識対象辞書152に格納されたホ
テル辞書データD531を用いて音声認識処理P11を
行い、認識結果「△△△ホテル」を出力する(S1
6)。認識結果「△△△ホテル」は、システム本体側へ
転送され、システム本体5のアプリケーション54で、
目的地設定、ルート検索などの処理P57に渡される
(S17)。
れると(S15)、認識対象辞書152に格納されたホ
テル辞書データD531を用いて音声認識処理P11を
行い、認識結果「△△△ホテル」を出力する(S1
6)。認識結果「△△△ホテル」は、システム本体側へ
転送され、システム本体5のアプリケーション54で、
目的地設定、ルート検索などの処理P57に渡される
(S17)。
【0096】第3の発声「辞書へ登録」が入力される
(S18)と、音声認識処理P11は、コマンド辞書1
51を用いて音声認識処理を行い認識結果「辞書へ登
録」を出力する(S19)。認識結果「辞書へ登録」を
受けて、辞書登録処理153は、音声認識マイク側のユ
ーザ登録辞書154に、「△△△ホテル」を登録する
(S20)。ユーザ登録辞書154の単語数は、100
単語とする。
(S18)と、音声認識処理P11は、コマンド辞書1
51を用いて音声認識処理を行い認識結果「辞書へ登
録」を出力する(S19)。認識結果「辞書へ登録」を
受けて、辞書登録処理153は、音声認識マイク側のユ
ーザ登録辞書154に、「△△△ホテル」を登録する
(S20)。ユーザ登録辞書154の単語数は、100
単語とする。
【0097】登録後は、ユーザは、目的地を第1の発声
として、いきなり「△△△ホテル」を発声する(S2
1)と、ユーザ登録辞書152に格納されたユーザ登録
辞書データD154を用いて音声認識処理P11を行
い、認識結果「△△△ホテル」を出力する(S16)。
認識結果「△△△ホテル」は、システム本体側へ転送さ
れ、システム本体5のアプリケーション54で、目的地
設定、ルート検索などの処理P57に渡される(S1
7)。
として、いきなり「△△△ホテル」を発声する(S2
1)と、ユーザ登録辞書152に格納されたユーザ登録
辞書データD154を用いて音声認識処理P11を行
い、認識結果「△△△ホテル」を出力する(S16)。
認識結果「△△△ホテル」は、システム本体側へ転送さ
れ、システム本体5のアプリケーション54で、目的地
設定、ルート検索などの処理P57に渡される(S1
7)。
【0098】このように、本発明によれば、必要な単語
を選択してユーザ辞書154に登録した後は、ユーザは
直ちに「△△△ホテル」と発生するだけで音声認識が実
行される。さらに、先にも述べた通り、ユーザ登録辞書
154の単語数は、100単語と少ないので、認識応答
時間および認識率の面で、良好な認識性能を発揮するこ
とができ、音声認識インタフェースの向上が期待でき
る。
を選択してユーザ辞書154に登録した後は、ユーザは
直ちに「△△△ホテル」と発生するだけで音声認識が実
行される。さらに、先にも述べた通り、ユーザ登録辞書
154の単語数は、100単語と少ないので、認識応答
時間および認識率の面で、良好な認識性能を発揮するこ
とができ、音声認識インタフェースの向上が期待でき
る。
【0099】さらに、この音声認識システムは、音声認
識処理におけるシステム本体の負荷が大幅に軽減される
ので、音声認識マイクからの認識結果を受信できるイン
タフェースを追加するだけで、既存の様々なシステムに
応用できる。
識処理におけるシステム本体の負荷が大幅に軽減される
ので、音声認識マイクからの認識結果を受信できるイン
タフェースを追加するだけで、既存の様々なシステムに
応用できる。
【0100】
【発明の効果】本発明によれば、カーナビゲーションシ
ステム、小型情報システム、ゲームに用いられる音声認
識システムにおいて、実際に使用する環境で、雑音のレ
ベルに合わせて音声区間検出用しきい値の設定を自動化
し、自動しきい値設定による音声区間検出および、認識
性能が実環境下でも劣化しない、良好な音声認識システ
ムを実現することができる。
ステム、小型情報システム、ゲームに用いられる音声認
識システムにおいて、実際に使用する環境で、雑音のレ
ベルに合わせて音声区間検出用しきい値の設定を自動化
し、自動しきい値設定による音声区間検出および、認識
性能が実環境下でも劣化しない、良好な音声認識システ
ムを実現することができる。
【図1】本発明にかかる音声認識マイクの機能の概要を
説明するブロック図。
説明するブロック図。
【図2】本発明にかかる音声認識マイクのハードウエア
構成を示すブロック図。
構成を示すブロック図。
【図3】本発明にかかる音声認識システムの概要を説明
するブロック図。
するブロック図。
【図4】本発明にかかる音声認識システムにおける辞書
構成を説明する図。
構成を説明する図。
【図5】本発明にかかる音声認識システムの動作を説明
する図。
する図。
【図6】従来の音声認識システムを使用した携帯型翻訳
装置の構成を説明するブロック図。
装置の構成を説明するブロック図。
【図7】従来の音声認識システムの動作を説明する図。
1 音声認識マイク 11 音声認識マイク 13 音声認識部 131 A/D変換器 132 音声区間切出部 133 音声分析処理部 134 音声認識処理部 135 音響モデル格納部 15 辞書部 151 コマンド辞書 152 認識対象辞書 153 辞書登録処理部 154 ユーザ登録辞書 17 データ通信部 21 アンプ 22 A/D変換器 23 CPU 24 ROM 25 RAM 26 インタフェース 29 音声入力ボタン 3 認識結果 4 通信手段 5 システム本体 51データ通信部 52 辞書読出部 53 認識対象大規模辞書 531 ホテル単語辞書 532 パーク単語辞書 533 スキー場単語辞書 54 アプリケーションソフ 55 音声合成部 56 表示部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 3/00 571A (72)発明者 小窪 浩明 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 畑岡 信夫 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 Fターム(参考) 5B075 ND02 PP07 PP22 PQ02 PQ04 PQ05 UU01 5D015 DD02 GG03 LL09 LL11 9A001 CC05 EE05 HH16 HH17 JJ77 JZ76
Claims (9)
- 【請求項1】 音声認識の対象となる単語や文章を集め
て辞書として定義し、音声認識結果に基づいてそれらの
単語や文章を取り出して、後続する情報処理用データや
文字列表示や単語が示す画像などとして出力したり、認
識結果を音声合成を用いて音声として出力する音声認識
システムにける音声認識機能を備えた音声認識マイクに
おいて、マイク単体の機能を有するマイク部と、マイク
部からのアナログ信号をデジタル信号に変換するA/D
変換器と、音声区間を検出する音声区間検出処理と、取
り込んだ音声に対して音声分析する音声分析処理と、音
声の特徴を音素単位でもつ音響モデルと、あらかじめ登
録された辞書と音響モデルを連結して、音響モデルと連
結された全ての辞書において、入力された音声の音声分
析結果と照合し、確からしい認識結果を出力する音声認
識処理部を備え、マイクから音声認識結果を出力するこ
とを特徴とする音声認識マイク。 - 【請求項2】 音声の入力から音声認識結果を出力する
までの一連の音声認識処理を行う音声認識部と、音声認
識結果を用いて新たな処理を実行するシステム本体へ認
識結果を転送しシステム本体から認識対象データを転送
するデータ通信部と、認識対象となる辞書を含む辞書部
を有していることを特徴とする請求項1に記載の音声認
識マイク。 - 【請求項3】 データ通信部は、音声認識マイクとシス
テム本体を有線または無線もしくは赤外線通信で接続す
るインタフェースであり、通信されるデータはデジタル
データであり、その内容は、音声認識結果を表すテキス
トデータおよび/またはデジタル化された音声波形デー
タおよび/または音声でない雑音Nと音声Sのレベルを
示すS/N比のデータであることを特徴とする請求項2
に記載の音声認識マイク。 - 【請求項4】 これから音声を入力することを音声認識
マイクに知らせるための音声入力通知手段を接続するた
めのインタフェースを有することを特徴とする請求項1
ないし請求項3のいずれか1項に記載の音声認識マイ
ク。 - 【請求項5】 あらかじめ音声認識マイクに登録してた
コマンド辞書と、システム本体の記憶媒体に登録された
大規模な辞書から認識対象となる辞書を読み出した認識
対象辞書と、ユーザの登録処理によって作成されるユー
ザ登録辞書とを有することを特徴とする請求項1ないし
請求項4のいずれか1項に記載の音声認識マイク。 - 【請求項6】 音声認識機能を有し入力された音声を認
識した結果を出力する音声認識マイクと、音声認識結果
を用いて後続する処理を実行する情報処理手段からなる
音声認識システム。 - 【請求項7】 上記音声認識マイクが音声認識処理部と
辞書部とデータ通信部を有し、上記情報処理手段が音声
認識に使用する認識対象辞書とデータ通信部を有し、前
記音声認識マイクでの音声認識結果に基づいて音声認識
マイクの辞書部に前記情報処理手段の認識対象辞書の一
部分を転送し、転送された認識対象辞書を用いて音声認
識することを特徴とする請求項6に記載の音声認識シス
テム。 - 【請求項8】 上記音声認識マイクの辞書部にユーザ登
録辞書を設け、該ユーザ辞書に認識対象辞書の中のユー
ザが必要とする単語を登録し、通常の音声認識では、コ
マンド辞書とユーザ登録辞書を認識対象として音声認識
することを特徴とする請求項6または請求7に記載の音
声認識システム。 - 【請求項9】 音声認識処理部と辞書部とデータ通信部
を有する音声認識マイクと、音声認識結果に基づいて処
理を行う情報処理手段とからなる音声認識システムの音
声認識方法において、音声認識マイクの辞書部に、コマ
ンド辞書と、情報処理手段から転送された認識対象辞書
と、ユーザ登録辞書とを備え、認識対象辞書の中から最
終的にユーザが必要とする複数の単語を集めてユーザ登
録辞書を作成し、通常の音声認識ではコマンド辞書とユ
ーザ登録辞書を認識対象として音声認識することを特徴
とする音声認識システムの音声認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11133659A JP2000322088A (ja) | 1999-05-14 | 1999-05-14 | 音声認識マイクおよび音声認識システムならびに音声認識方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11133659A JP2000322088A (ja) | 1999-05-14 | 1999-05-14 | 音声認識マイクおよび音声認識システムならびに音声認識方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2000322088A true JP2000322088A (ja) | 2000-11-24 |
Family
ID=15109947
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11133659A Pending JP2000322088A (ja) | 1999-05-14 | 1999-05-14 | 音声認識マイクおよび音声認識システムならびに音声認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2000322088A (ja) |
Cited By (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002330194A (ja) * | 2001-04-27 | 2002-11-15 | Kenwood Corp | 電話装置、音声合成システム、音素情報登録装置、音素情報登録・音声合成装置 |
| JP2003029784A (ja) * | 2001-04-20 | 2003-01-31 | Koninkl Philips Electronics Nv | データベースのエントリを決定する方法 |
| JP2003215707A (ja) * | 2002-01-22 | 2003-07-30 | Seiko Epson Corp | プレゼンテーションシステム |
| JP2003216174A (ja) * | 2002-01-22 | 2003-07-30 | Seiko Epson Corp | プロジェクタの遠隔操作装置 |
| WO2005055198A1 (en) * | 2003-12-04 | 2005-06-16 | Toyota Infotechnology Center Co., Ltd. | Shortcut names for use in a speech recognition system |
| EP1672320A1 (en) * | 2004-12-15 | 2006-06-21 | Aisin Aw Co., Ltd. | Navigation apparatus and input/output apparatus with voice recognition |
| US7231343B1 (en) | 2001-12-20 | 2007-06-12 | Ianywhere Solutions, Inc. | Synonyms mechanism for natural language systems |
| JP2011118822A (ja) * | 2009-12-07 | 2011-06-16 | Nec Casio Mobile Communications Ltd | 電子機器、発話検出装置、音声認識操作システム、音声認識操作方法及びプログラム |
| CN106128454A (zh) * | 2016-07-08 | 2016-11-16 | 成都之达科技有限公司 | 基于车联网的语音信号匹配方法 |
| JPWO2014199602A1 (ja) * | 2013-06-10 | 2017-02-23 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 話者識別方法、話者識別装置及び情報管理方法 |
| JP2018189904A (ja) * | 2017-05-11 | 2018-11-29 | オリンパス株式会社 | 収音装置、収音方法、収音プログラム、ディクテーション方法、情報処理装置及び情報処理プログラム |
| JP2020046563A (ja) * | 2018-09-20 | 2020-03-26 | Dynabook株式会社 | 電子機器、音声認識方法及びプログラム |
-
1999
- 1999-05-14 JP JP11133659A patent/JP2000322088A/ja active Pending
Cited By (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003029784A (ja) * | 2001-04-20 | 2003-01-31 | Koninkl Philips Electronics Nv | データベースのエントリを決定する方法 |
| JP2002330194A (ja) * | 2001-04-27 | 2002-11-15 | Kenwood Corp | 電話装置、音声合成システム、音素情報登録装置、音素情報登録・音声合成装置 |
| US7231343B1 (en) | 2001-12-20 | 2007-06-12 | Ianywhere Solutions, Inc. | Synonyms mechanism for natural language systems |
| JP2003216174A (ja) * | 2002-01-22 | 2003-07-30 | Seiko Epson Corp | プロジェクタの遠隔操作装置 |
| JP2003215707A (ja) * | 2002-01-22 | 2003-07-30 | Seiko Epson Corp | プレゼンテーションシステム |
| WO2005055198A1 (en) * | 2003-12-04 | 2005-06-16 | Toyota Infotechnology Center Co., Ltd. | Shortcut names for use in a speech recognition system |
| US7292978B2 (en) | 2003-12-04 | 2007-11-06 | Toyota Infotechnology Center Co., Ltd. | Shortcut names for use in a speech recognition system |
| EP1672320A1 (en) * | 2004-12-15 | 2006-06-21 | Aisin Aw Co., Ltd. | Navigation apparatus and input/output apparatus with voice recognition |
| JP2011118822A (ja) * | 2009-12-07 | 2011-06-16 | Nec Casio Mobile Communications Ltd | 電子機器、発話検出装置、音声認識操作システム、音声認識操作方法及びプログラム |
| JPWO2014199602A1 (ja) * | 2013-06-10 | 2017-02-23 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 話者識別方法、話者識別装置及び情報管理方法 |
| CN106128454A (zh) * | 2016-07-08 | 2016-11-16 | 成都之达科技有限公司 | 基于车联网的语音信号匹配方法 |
| JP2018189904A (ja) * | 2017-05-11 | 2018-11-29 | オリンパス株式会社 | 収音装置、収音方法、収音プログラム、ディクテーション方法、情報処理装置及び情報処理プログラム |
| JP2020046563A (ja) * | 2018-09-20 | 2020-03-26 | Dynabook株式会社 | 電子機器、音声認識方法及びプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20080177541A1 (en) | Voice recognition device, voice recognition method, and voice recognition program | |
| EP1450349B1 (en) | Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus | |
| JP4412504B2 (ja) | 音声認識装置、音声認識方法、及び音声認識用プログラム | |
| KR100679042B1 (ko) | 음성인식 방법 및 장치, 이를 이용한 네비게이션 시스템 | |
| JPH096389A (ja) | 音声認識対話処理方法および音声認識対話装置 | |
| JP3476007B2 (ja) | 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体 | |
| JP4468264B2 (ja) | 多言語による名称の音声認識のための方法とシステム | |
| JP2000322088A (ja) | 音声認識マイクおよび音声認識システムならびに音声認識方法 | |
| JP2002116793A (ja) | データ入力システム及びその方法 | |
| JP2003114696A (ja) | 音声認識装置、プログラム及びナビゲーションシステム | |
| EP1024476A1 (en) | Speech recognizing device and method, navigation device, portable telephone, and information processor | |
| JP3726783B2 (ja) | 音声認識装置 | |
| JP4262837B2 (ja) | 音声認識機能を用いたナビゲーション方法 | |
| JPH09114634A (ja) | マルチモーダル情報統合解析装置 | |
| JP3645104B2 (ja) | 辞書検索装置及び辞書検索プログラムを記録した記録媒体 | |
| JP4914632B2 (ja) | ナビゲーション装置 | |
| JP3588975B2 (ja) | 音声入力装置 | |
| CN114964300B (zh) | 一种语音识别方法及导航装置 | |
| JP2011039468A (ja) | 電子辞書で音声認識を用いた単語探索装置及びその方法 | |
| JP2000187493A (ja) | 音声出力装置および車載用コンピュータ | |
| JP4004885B2 (ja) | 音声制御装置 | |
| JP2005227369A (ja) | 音声認識装置および方法と車載ナビゲーション装置 | |
| CN101114283A (zh) | 旅游机 | |
| JP2001306088A (ja) | 音声認識装置及び処理システム | |
| JPH05119793A (ja) | 音声認識方法及び装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060301 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060328 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060718 |