JP2008145676A - Speech recognition device and vehicle navigation device - Google Patents
Speech recognition device and vehicle navigation device Download PDFInfo
- Publication number
- JP2008145676A JP2008145676A JP2006331876A JP2006331876A JP2008145676A JP 2008145676 A JP2008145676 A JP 2008145676A JP 2006331876 A JP2006331876 A JP 2006331876A JP 2006331876 A JP2006331876 A JP 2006331876A JP 2008145676 A JP2008145676 A JP 2008145676A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- dictionary
- speech
- user
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 claims description 24
- 238000000034 method Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Landscapes
- Navigation (AREA)
- Traffic Control Systems (AREA)
Abstract
Description
本発明は、ユーザが発した音声の音声波形と複数の音声辞書のうちから使用辞書として切替えた音声辞書に登録されている語句の近似波形とを照合して当該ユーザが発した音声を音声認識する音声認識装置及び車両ナビゲーション装置に関する。 The present invention recognizes a voice uttered by a user by collating a voice waveform of a voice uttered by a user with an approximate waveform of a word registered in a voice dictionary switched from a plurality of voice dictionaries as a use dictionary. The present invention relates to a voice recognition device and a vehicle navigation device.
例えば車両ナビゲーション装置に搭載されている音声認識装置では、ユーザが発した音声の音声波形と音声辞書に登録されている語句の近似波形とを照合して当該ユーザが発した音声を音声認識するように構成されている(例えば特許文献1参照)。
ところで、近年では、機能追加に伴って音声認識が多種多様な状況で使用されるようになっており、それに伴って、例えば住所用の音声辞書、施設名称用の音声辞書及びナビゲーション機能制御用の音声辞書などの用途に応じて複数の音声辞書を用意しておき、最初に複数の音声辞書のうちからいずれかを使用辞書として切替え、続いて音声認識させたい音声の音声波形と使用辞書として切替えた音声辞書に登録されている語句の近似波形とを照合し、音声認識させたい音声を音声認識する構成が供されている。 By the way, in recent years, with the addition of functions, voice recognition has been used in a wide variety of situations. Along with this, for example, a voice dictionary for addresses, a voice dictionary for facility names, and navigation function control Prepare multiple voice dictionaries according to the purpose of the voice dictionary, etc., first switch one of the multiple voice dictionaries as the use dictionary, then switch as the voice waveform of the voice you want to recognize and the use dictionary There is provided a configuration for recognizing a speech to be recognized by collating with an approximate waveform of a word registered in the speech dictionary.
この場合、ユーザは、最初に複数の音声辞書のうちからいずれかを使用辞書として切替えるための語句を発声し、続いて音声認識させたい語句を発声する。具体的には、ユーザは、最初に例えば「ジ」「ュ」「ウ」「シ」「ョ」と発声することにより、住所用の音声辞書を使用辞書として切替えることができ、続いて例えば「ア」「イ」「チ」「ケ」「ン」と発声することにより、音声認識させたい「愛知県」という語句を音声認識させることができる。 In this case, the user first utters a phrase for switching one of the plurality of voice dictionaries as a use dictionary, and then utters a phrase to be voice-recognized. Specifically, the user can first switch the address voice dictionary as a use dictionary by, for example, saying “ji” “yu” “u” “shi” “yo”. By saying “a”, “b”, “chi”, “ke”, and “n”, the word “Aichi” that is desired to be recognized can be recognized.
しかしながら、これでは、使用辞書を切替えるための語句と音声認識させたい語句との2つの語句を音声認識することになるので、ユーザにとって語句を2回発声することが煩雑であり、また、ユーザが音声認識させたい語句を音声認識するまでに時間がかかり、操作性に劣るという問題があった。 However, in this case, since two words, a word for switching the dictionary to be used and a word to be recognized by voice, are recognized by voice, it is troublesome for the user to utter the word twice. There is a problem that it takes time until speech recognition is performed for a phrase to be recognized, which is inferior in operability.
本発明は、上記した事情に鑑みてなされたものであり、その目的は、ユーザにとって語句を発声する負担を軽減することができると共に、ユーザが音声認識させたい語句を速やかに音声認識することができ、操作性を高めることができる音声認識装置及び車両ナビゲーション装置を提供することにある。 The present invention has been made in view of the above-described circumstances, and an object of the present invention is to reduce the burden on a user to speak a phrase and to quickly recognize a phrase that the user wants to recognize by speech. It is possible to provide a voice recognition device and a vehicle navigation device that can improve operability.
請求項1に記載した発明によれば、操作位置検出手段は、複数の音声辞書に対応して操作対象に設定されている複数の操作位置のうちからユーザの操作位置を検出し、音声辞書切替手段は、複数の音声辞書のうちから操作位置検出手段が検出した操作位置に対応する音声辞書を使用辞書として切替える。そして、音声認識手段は、ユーザが発した音声を音声入力手段が入力すると、その音声入力手段が入力した音声の音声波形と音声辞書切替手段が使用辞書として切替えた音声辞書に登録されている語句の近似波形とを照合して当該ユーザが発した音声を音声認識する。 According to the first aspect of the present invention, the operation position detecting means detects a user's operation position from among a plurality of operation positions set as operation targets corresponding to a plurality of voice dictionaries, and switches voice dictionaries. The means switches the voice dictionary corresponding to the operation position detected by the operation position detection means from among a plurality of voice dictionaries as a use dictionary. When the voice input unit inputs the voice uttered by the user, the voice recognition unit and the speech waveform input by the voice input unit and the phrase registered in the voice dictionary switched by the voice dictionary switching unit The voice generated by the user is recognized by collating with the approximate waveform.
これにより、ユーザの操作位置に基づいて複数の音声辞書のうちからいずれかを使用辞書として切替えることにより、ユーザが複数の音声辞書のうちからいずれかを使用辞書として切替えるための語句を発声する必要がなくなり、ユーザが音声認識させたい語句のみを発声すれば良く、ユーザにとって語句を発声する負担を軽減することができると共に、ユーザが音声認識させたい語句を速やかに音声認識することができ、操作性を高めることができる。 Accordingly, it is necessary for the user to utter a phrase for switching any one of the plurality of voice dictionaries as the use dictionary by switching any one of the plurality of voice dictionaries based on the operation position of the user. It is sufficient that the user speaks only the words and phrases that the user wants to recognize, and the burden on the users to speak the words can be reduced, and the user can quickly recognize the words and phrases that the user wants to recognize. Can increase the sex.
請求項2に記載した発明によれば、音声辞書切替手段は、自装置が音声認識待ち状態に移行する前に、複数の音声辞書のうちから操作位置検出手段が検出した操作位置に対応する音声辞書を使用辞書として切替えるので、自装置が音声認識待ち状態に移行した時点では、既に複数の音声辞書のうちからいずれかを使用辞書として切替えておくことができ、ユーザが音声認識させたい語句をより速やかに音声認識することができる。 According to the second aspect of the present invention, the voice dictionary switching unit is configured to provide a voice corresponding to the operation position detected by the operation position detection unit from among a plurality of voice dictionaries before the own device shifts to the voice recognition standby state. Since the dictionary is switched as the use dictionary, when the device shifts to the voice recognition standby state, one of the plurality of voice dictionaries can be already switched as the use dictionary, and the word or phrase that the user wants to recognize by voice can be selected. Speech can be recognized more promptly.
請求項3に記載した発明によれば、操作対象は、ステアリングであり、操作位置検出手段は、ユーザがステアリングを握っている位置を検出し、音声辞書切替手段は、複数の音声辞書のうちから操作位置検出手段が検出したステアリング握り位置に対応する音声辞書を使用辞書として切替えるので、ユーザがステアリングを握る位置を切替えることにより、複数の音声辞書のうちからいずれかを使用辞書として切替えることができる。 According to the third aspect of the present invention, the operation target is steering, the operation position detection unit detects a position where the user is grasping the steering, and the voice dictionary switching unit is selected from the plurality of voice dictionaries. Since the speech dictionary corresponding to the steering wheel position detected by the operation position detection means is switched as the use dictionary, any one of the plurality of speech dictionaries can be switched as the use dictionary by switching the position at which the user grips the steering wheel. .
請求項4に記載した発明によれば、操作対象は、ステアリングの一部であるので、ステアリングの操作対象とされている箇所を一方の手で握ることにより複数の音声辞書のうちからいずれかを使用辞書として切替えることができると共に、ステアリングの操作対象とされていない箇所を他方の手で握ることにより運転操作することができ、運転操作に支障を来たすことなく複数の音声辞書のうちからいずれかを使用辞書として容易に切替えることができる。
According to the invention described in
請求項5に記載した発明によれば、握り圧力検出手段は、ユーザがステアリングを握っている握り圧力を検出し、その握り圧力検出手段が検出した握り圧力が閾値以上であると、自装置が音声認識待ち状態に移行するので、ユーザが例えばステアリングから手を離して別のスイッチを操作しなくとも、ユーザがステアリングを握ったまま閾値以上の握り圧力で握ることにより、音声認識待ち状態に移行することができ、操作性をより一層高めることができる。
According to the invention described in
請求項6に記載した発明によれば、音声辞書割当切替手段は、ステアリングの握り位置に対する音声辞書の割当を切替えるので、例えばステアリングにあってユーザが握り易い位置に使用頻度が高い音声辞書を割当てることにより、操作性をより一層高めることができる。
According to the invention described in
以下、本発明の一実施形態について、図面を参照して説明する。図2は、車両ナビゲーション装置の構成を機能ブロック図として示している。車両ナビゲーション装置1は、制御装置2、位置検出器3、地図データ記憶装置4、操作スイッチ群5、車両信号入出力器6、通信装置7、VICS受信機8、音声制御装置9、音声認識装置10、表示装置11、メモリ12及びリモコンセンサ13を備えて構成されている。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings. FIG. 2 shows the configuration of the vehicle navigation apparatus as a functional block diagram. The vehicle navigation device 1 includes a
制御装置2は、CPU、ROM、RAM、I/Oインタフェース、これらを接続するバスなど(いずれも図示せず)を備えて構成されており、車両ナビゲーション装置1の動作全般を制御する。位置検出器3は、Gセンサ3a、ジャイロスコープ3b、距離センサ3c及びGPS受信機3dから構成されており、これら位置検出器3の各構成要素は互いに性質の異なる検出誤差を有している。この場合、制御装置2は、位置検出器3の各構成要素から検出信号を入力すると、それら入力した検出信号を互いに補完し、自車両の現在位置及び進行方向などを検出(特定)する。
The
地図データ記憶装置4は、例えばDVD−ROMなどの記録媒体14から転送された地図データを記憶する。この場合、記録媒体14は、経路案内に使用する地図データを記録していると共に、図1に示すように、音声辞書として住所用の音声辞書15a、施設名称用の音声辞書15b及びナビゲーション機能制御用の音声辞書15cなどの用途に応じた複数(本実施形態では3個)の音声辞書を記録している。尚、記録媒体14は、例えばHDDやメモリカードなどであっても良い。操作スイッチ群5は、表示装置11の周辺に配置されているメカニカルスイッチ、表示装置11の例えばカラー液晶ディスプレイ上に形成されるタッチスイッチ及び車室内の所定位置に配置されているPTTスイッチなどから構成されている。
The map
車両信号入出力器6は、車両に搭載されている各種センサや車載機器との間で各種信号を入出力し、例えば車速センサから車速を表す車速信号を入力すると共に、ステアリング16(本発明でいう操作対象)からユーザが当該ステアリング16を握っている位置(握り位置)を表す握り位置信号を入力する。ステアリング16は、図3に示すように、その正面視にて円環状のリム部の左半部の領域に3個の曲線形状をなす圧力センサ17a〜17cが均等に埋込まれており、各々の圧力センサ17a〜17cは、ユーザがステアリング16の該当する箇所を握っていることに応じて所定値以上の圧力を検出すると、ユーザがステアリング16の該当する箇所を握っている旨を表す握り位置信号を出力する。この場合、各々の圧力センサ17a〜17cは、ユーザがステアリングを握っている握り圧力を示す数値を握り位置信号に含めて出力する。
The vehicle signal input /
ここで、各々の圧力センサ17a〜17cが埋込まれている箇所は、上記した記録媒体14に記録されている3個の音声辞書15a〜15cに対応している。具体的には、圧力センサ17aが埋込まれている箇所は、住所用の音声辞書15aに対応しており、圧力センサ17bが埋込まれている箇所は、施設名称用の音声辞書17bに対応しており、圧力センサ17cが埋込まれている箇所は、ナビゲーション機能制御用の音声辞書17cに対応している。
Here, the locations where the respective pressure sensors 17a to 17c are embedded correspond to the three
通信装置7は、移動通信網との間で通信する。VICS受信機8は、外部からVICS情報を受信する。音声制御装置9は、車室内の所定位置に配置されているマイクロホン18が入力した音声及び車室内の所定位置に配置されているスピーカ19が出力する音声を音声制御する。
The
音声認識装置10は、図1に示すように、機能毎に、握り位置検出部20a(本発明でいう操作位置検出手段、握り圧力検出手段)、音声辞書切替部20b(本発明でいう音声辞書切替手段、音声辞書割当切替手段)、音声辞書格納部20c、音声入力部20d(本発明でいう音声入力手段)、音声認識部20e(本発明でいう音声認識手段)及び認識結果出力部20fを備えて構成されている。
As shown in FIG. 1, the
握り位置検出部20aは、ステアリング16から出力された握り位置信号を車両信号入出力器6を介して入力すると、その握り位置信号を解析してユーザがステアリング16を握っている位置(握り位置)を検出すると共に、ユーザがステアリングを握っている握り圧力をも検出する。音声辞書切替部20bは、DVD14に記録されている住所用の音声辞書15a、施設名称用の音声辞書15b及びナビゲーション機能制御用の音声辞書15cからいずれかを使用辞書として切替える(選択する)。また、音声辞書切替部20bは、例えばユーザが操作スイッチ群5にて音声辞書の割当を切替える操作を行うと、上記した圧力センサ17a〜17cが埋込まれている箇所と記録媒体14に記録されている3個の音声辞書15a〜15cとの対応(割当)を切替える。音声辞書格納部20cは、音声辞書切替部20bが使用辞書として切替えた音声辞書を格納する。
When the grip
音声入力部20dは、マイクロホン18が入力した音声を音声制御装置9を介して入力する。音声認識部20eは、音声入力部20dが音声を入力すると、音声辞書切替部20bが格納している音声辞書、つまり、音声辞書切替部20bが使用辞書として切替えた音声辞書を参照し、音声入力部20dが入力した音声の音声波形と音声辞書格納部20cが使用辞書として格納している音声辞書に登録されている語句の近似波形とを照合し、ユーザが発した音声を音声認識する。認識結果出力部20fは、音声認識部20eが音声認識した認識結果を制御装置2に出力する。
The
制御装置2は、このようにして音声認識装置10から入力した認識結果に基づいて、例えば目的地を検索したり地図表示の縮尺を変更したりする。尚、音声認識装置10は、例えば上記したPTTスイッチが押下されている期間に音声認識待ち状態となり、上記した音声認識を行うことが可能になる。
Based on the recognition result input from the
表示装置11は、例えばカラー液晶ディスプレイから構成されており、自車両の現在位置を表す現在位置図形や走行軌跡を地図データに対応する地図上に重ねて表示する。尚、表示装置10は、有機ELやプラズマディスプレイなどから構成されていても良い。メモリ12は、例えば着脱可能なフラッシュメモリカードなどにより構成されている。リモコンセンサ13は、操作リモコン21から送信された操作信号を受信して制御装置2に出力する。
The
次に、上記した構成の作用として、音声認識装置10が行う処理を図4に示すフローチャートを参照して説明する。
音声認識装置10は、ユーザがPTTスイッチを押下したことに応じて音声認識待ち状態に移行すると、その時点でステアリング16から車両信号入出力器6を介して入力している握り位置信号を解析してユーザがステアリング16を握っている位置(握り位置)を握り位置検出部20aにて検出する(ステップS1)。
Next, as an operation of the above-described configuration, processing performed by the
When the
次いで、音声認識装置10は、その時点で音声辞書格納部20cが格納している音声辞書、つまり、音声辞書切替部20bが使用辞書として切替えている音声辞書を参照し(ステップS2)、音声辞書切替部20bが使用辞書として切替えている音声辞書が当該検出した握り位置に対応しているか否かを判定する(ステップS3)。
Next, the
ここで、音声認識装置10は、音声辞書切替部20bが使用辞書として切替えている音声辞書が当該検出した握り位置に対応している旨を判定すると(ステップS3にて「YES」)、ユーザが発した音声の入力を待機すると共に(ステップS6)、音声認識待ち状態を解除したか否かを判定する(ステップS7)。そして、音声認識装置10は、ユーザが発した音声を音声入力部20dにて入力した旨を判定すると(ステップS6にて「YES」)、入力した音声の音声波形と使用辞書として切替えている音声辞書に登録されている語句の近似波形とを照合してユーザが発した音声を音声認識部20eにて音声認識し(ステップS8)、その音声認識した認識結果を制御装置2に出力し(ステップS9)、
上記したステップS1に戻り、上記した一連の処理を繰返して行う。
Here, when the
Returning to step S1, the above-described series of processing is repeated.
一方、音声認識装置10は、音声辞書切替部20bが使用辞書として切替えている音声辞書が当該検出した握り位置に対応していない旨を判定すると(ステップS3にて「NO」)、検出した握り位置に対応する音声辞書を使用辞書として切替え(ステップS4)、使用辞書として切替えた音声辞書を音声辞書格納部20cに格納する(ステップS5)。そして、音声認識装置10は、ユーザが発した音声の入力を待機すると共に(ステップS6)、音声認識待ち状態を解除したか否かを判定し(ステップS7)、ユーザが発した音声を入力した旨を判定すると(ステップS6にて「YES」)、これ以降、上記したステップS8,S9を行う。
On the other hand, when the
また、音声認識装置10は、PTTスイッチの押下が解除されたことに応じて音声認識待ち状態を解除した旨を判定すると(ステップS7にて「YES」)、上記した一連の処理を終了する。
When the
ところで、以上は、ユーザがPTTスイッチを押下したことに応じて音声認識待ち状態に移行する構成を説明したが、握り位置検出部20aが検出した握り圧力が閾値以上であることを条件として音声認識待ち状態に移行する構成であっても良い。また、ユーザがPTTスイッチを押下したことに応じて音声認識待ち状態に移行した後に、ユーザがステアリング16を握っている位置に応じて音声辞書を切替える構成を説明したが、例えば車両ナビゲーション装置1が起動している場合に、ユーザがPTTスイッチを押下していない状況であっても、ユーザがステアリング16を握っている位置に応じて音声辞書を切替える構成であっても良い。
By the way, the above has described the configuration in which the user shifts to the voice recognition waiting state in response to the user pressing the PTT switch. However, the voice recognition is performed on condition that the grip pressure detected by the grip
以上に説明したように本実施形態によれば、音声認識装置10において、ユーザがステアリング16を握っている位置を検出し、複数の音声辞書15a〜15cのうちから握り位置に対応する音声辞書を使用辞書として切替え、ユーザが発した音声を入力すると、その入力した音声の音声波形と使用辞書として切替えた音声辞書に登録されている語句の近似波形とを照合して当該ユーザが発した音声を音声認識するように構成したので、ユーザが複数の音声辞書15a〜15cのうちからいずれかを使用辞書として切替えるための語句を発声する必要がなくなり、ユーザが音声認識させたい語句のみを発声すれば良く、ユーザにとって語句を発声する負担を軽減することができると共に、ユーザが音声認識させたい語句を速やかに音声認識することができ、操作性を高めることができる。
As described above, according to the present embodiment, the
また、音声認識装置10が音声認識待ち状態に移行する前に、複数の音声辞書15a〜15cのうちから握り位置に対応する音声辞書を使用辞書として切替えるように構成すれば、音声認識装置10が音声認識待ち状態に移行した時点では、既に複数の音声辞書15a〜15cのうちからいずれかを使用辞書として切替えておくことができ、ユーザが音声認識させたい語句をより速やかに音声認識することができる。
Further, if the
また、ステアリング16の左半部を利用してユーザがステアリング16を握っている位置を検出するように構成したので、ステアリング16の左半部を左手で握ることにより複数の音声辞書15a〜15cのうちからいずれかを使用辞書として切替えることができると共に、ステアリング16の右半部を右手で握ることにより運転操作することができ、運転操作に支障を来たすことなく複数の音声辞書15a〜15cのうちからいずれかを使用辞書として容易に切替えることができる。
In addition, since the position where the user is grasping the
また、握り位置検出部20aが検出した握り圧力が閾値以上であることを条件として音声認識待ち状態に移行するように構成すれば、ユーザが例えばステアリング16から手を離して別のスイッチを操作しなくとも、ユーザがステアリング16を握ったまま閾値以上の握り圧力で握ることにより、音声認識待ち状態に移行することができ、操作性をより一層高めることができる。
In addition, when the grip
さらに、例えばユーザが操作スイッチ群5にて音声辞書の割当を切替える操作を行うと、ステアリング16の握り位置に対する音声辞書の割当を切替えるように構成したので、ステアリング16にあってユーザが握り易い位置に使用頻度が高い音声辞書を割当てることにより、操作性をより一層高めることができる。
Furthermore, for example, when the user performs an operation of switching the assignment of the voice dictionary with the
本発明は、上記した実施形態にのみ限定されるものではなく、以下のように変形または拡張することができる。
操作対象は、ステアリングに限らず、運転操作に支障を来たすことがない範囲でユーザが運転中に操作可能な別の機器(例えばシフトレバーなど)であっても良い。
ユーザがステアリングを握っている位置を検出する手段として、圧力センサが利用される構成に限らず、例えば電極などの他のセンサが利用される構成であっても良い。また、センサがステアリングの右半部、下部あるいは上部に配置される構成であっても良い。
音声辞書は、住所用の音声辞書、施設名称用の音声辞書及びナビゲーション機能制御用の音声辞書以外の用途のものであっても良い。
ユーザがPTTスイッチを押下することやユーザがステアリングを閾値以上の握り圧力で握ること以外のユーザ操作をトリガとして音声認識装置が音声認識待ち状態に移行する構成であっても良い。
The present invention is not limited to the above-described embodiment, and can be modified or expanded as follows.
The operation target is not limited to the steering, but may be another device (for example, a shift lever) that can be operated by the user during driving within a range in which the driving operation is not hindered.
The means for detecting the position where the user is grasping the steering is not limited to the configuration in which the pressure sensor is used, and may be a configuration in which another sensor such as an electrode is used. Moreover, the structure by which a sensor is arrange | positioned at the right half part, lower part, or upper part of steering may be sufficient.
The voice dictionary may be used for purposes other than the address voice dictionary, the facility name voice dictionary, and the navigation function control voice dictionary.
A configuration in which the voice recognition device shifts to a voice recognition standby state triggered by a user operation other than the user pressing the PTT switch or the user gripping the steering wheel with a gripping pressure equal to or higher than a threshold value may be used.
図面中、1は車両ナビゲーション装置、10は音声認識装置、15a〜15cは音声辞書、16はステアリング(操作対象)、20aは握り位置検出部(操作位置検出手段、握り圧力検出手段)、20bは音声辞書切替部(音声辞書切替手段、音声辞書割当切替手段)、20dは音声入力部(音声入力手段)、20eは音声認識部(音声認識手段)である。 In the drawings, 1 is a vehicle navigation device, 10 is a speech recognition device, 15a to 15c are speech dictionaries, 16 is a steering (operation target), 20a is a grip position detection unit (operation position detection means, grip pressure detection means), and 20b is A speech dictionary switching unit (speech dictionary switching unit, speech dictionary allocation switching unit), 20d is a speech input unit (speech input unit), and 20e is a speech recognition unit (speech recognition unit).
Claims (7)
複数の音声辞書に対応して操作対象に設定されている複数の操作位置のうちからユーザの操作位置を検出する操作位置検出手段を備え、
前記音声辞書切替手段は、複数の音声辞書のうちから前記操作位置検出手段が検出した操作位置に対応する音声辞書を使用辞書として切替えることを特徴とする音声認識装置。 A voice dictionary switching means for switching one of a plurality of voice dictionaries as a use dictionary; a voice input means for inputting a voice uttered by a user; a voice waveform of the voice inputted by the voice input means; and the voice dictionary switching means. A speech recognition device comprising speech recognition means for recognizing speech uttered by the user by collating with an approximate waveform registered in a speech dictionary switched as a use dictionary,
An operation position detecting means for detecting a user's operation position from among a plurality of operation positions set as operation targets corresponding to a plurality of voice dictionaries;
The voice recognition apparatus characterized in that the voice dictionary switching means switches a voice dictionary corresponding to the operation position detected by the operation position detection means from a plurality of voice dictionaries as a use dictionary.
前記音声辞書切替手段は、自装置が音声認識待ち状態に移行する前に、複数の音声辞書のうちから前記操作位置検出手段が検出した操作位置に対応する音声辞書を使用辞書として切替えることを特徴とする音声認識装置。 The speech recognition apparatus according to claim 1,
The voice dictionary switching means switches the voice dictionary corresponding to the operation position detected by the operation position detection means from among a plurality of voice dictionaries as a use dictionary before the apparatus shifts to a voice recognition standby state. Voice recognition device.
前記操作対象は、ステアリングであり、
前記操作位置検出手段は、ユーザがステアリングを握っている位置を検出し、
前記音声辞書切替手段は、複数の音声辞書のうちから前記操作位置検出手段が検出したステアリング握り位置に対応する音声辞書を使用辞書として切替えることを特徴とする音声認識装置。 The speech recognition apparatus according to claim 1 or 2,
The operation target is steering,
The operation position detecting means detects a position where the user is holding the steering wheel,
The speech recognition apparatus characterized in that the speech dictionary switching means switches a speech dictionary corresponding to a steering grip position detected by the operation position detection means from a plurality of speech dictionaries as a use dictionary.
前記操作対象は、ステアリングの一部であることを特徴とする音声認識装置。 The speech recognition apparatus according to claim 3,
The speech recognition apparatus characterized in that the operation target is a part of a steering wheel.
ユーザがステアリングを握っている握り圧力を検出する握り圧力検出手段を備え、
前記握り圧力検出手段が検出した握り圧力が閾値以上である場合に、自装置が音声認識待ち状態に移行することを特徴とする音声認識装置。 The speech recognition device according to claim 3 or 4,
A grip pressure detecting means for detecting a grip pressure at which the user is gripping the steering wheel;
The speech recognition apparatus according to claim 1, wherein when the grip pressure detected by the grip pressure detection means is equal to or greater than a threshold value, the apparatus shifts to a speech recognition standby state.
ステアリングの握り位置に対する音声辞書の割当を切替える音声辞書割当切替手段を備えたことを特徴とする音声認識装置。 The speech recognition device according to any one of claims 3 to 5,
A speech recognition apparatus comprising speech dictionary assignment switching means for switching assignment of a speech dictionary to a steering position of a steering wheel.
前記音声認識装置が音声認識した認識結果に基づいてナビゲーションに係る処理を行うことを特徴とする車両ナビゲーション装置。 A voice recognition device according to any one of claims 1 to 6, comprising:
A vehicle navigation device that performs a process related to navigation based on a recognition result recognized by the voice recognition device.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006331876A JP2008145676A (en) | 2006-12-08 | 2006-12-08 | Speech recognition device and vehicle navigation device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006331876A JP2008145676A (en) | 2006-12-08 | 2006-12-08 | Speech recognition device and vehicle navigation device |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2008145676A true JP2008145676A (en) | 2008-06-26 |
Family
ID=39605935
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2006331876A Pending JP2008145676A (en) | 2006-12-08 | 2006-12-08 | Speech recognition device and vehicle navigation device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2008145676A (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014056258A (en) * | 2008-08-29 | 2014-03-27 | Mmodal Ip Llc | Distributed speech recognition with the use of one-way communication |
| JP2015526753A (en) * | 2012-06-15 | 2015-09-10 | 本田技研工業株式会社 | Scene recognition based on depth |
| JPWO2023286775A1 (en) * | 2021-07-13 | 2023-01-19 |
-
2006
- 2006-12-08 JP JP2006331876A patent/JP2008145676A/en active Pending
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014056258A (en) * | 2008-08-29 | 2014-03-27 | Mmodal Ip Llc | Distributed speech recognition with the use of one-way communication |
| US9502033B2 (en) | 2008-08-29 | 2016-11-22 | Mmodal Ip Llc | Distributed speech recognition using one way communication |
| JP2015526753A (en) * | 2012-06-15 | 2015-09-10 | 本田技研工業株式会社 | Scene recognition based on depth |
| JPWO2023286775A1 (en) * | 2021-07-13 | 2023-01-19 | ||
| JP7743868B2 (en) | 2021-07-13 | 2025-09-25 | 株式会社ニコン | Imaging device, voice recognition method, and voice recognition program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN106796786B (en) | voice recognition system | |
| JP5677650B2 (en) | Voice recognition device | |
| JP2004037998A (en) | Vocal controller | |
| JP5637131B2 (en) | Voice recognition device | |
| JP2009139544A (en) | Input device | |
| JP5277704B2 (en) | Voice recognition apparatus and vehicle system using the same | |
| JP4997796B2 (en) | Voice recognition device and navigation system | |
| JP2010039099A (en) | Speech recognition and in-vehicle device | |
| JP2008145676A (en) | Speech recognition device and vehicle navigation device | |
| JP4770374B2 (en) | Voice recognition device | |
| JP4736404B2 (en) | Voice recognition device | |
| JP4453377B2 (en) | Voice recognition device, program, and navigation device | |
| JP2017146531A (en) | Voice guidance system | |
| JP2006208486A (en) | Voice input device | |
| JP4608670B2 (en) | Speech recognition apparatus and speech recognition method | |
| JP2010107614A (en) | Voice guidance and response method | |
| JP4093394B2 (en) | Voice recognition device | |
| JP4942406B2 (en) | Navigation device and voice output method thereof | |
| JP2003005781A (en) | Controller with voice recognition function and program | |
| JP2005084589A (en) | Voice recognition device | |
| JP2004233542A (en) | Voice recognition device | |
| JP2002132290A (en) | On-vehicle speech recognizer | |
| JP2008176221A (en) | In-vehicle voice recognition system | |
| KR20060057726A (en) | Interactive navigation system and its control method | |
| JPH11325946A (en) | Car navigation system |