JP2007121579A - Operation device - Google Patents
Operation device Download PDFInfo
- Publication number
- JP2007121579A JP2007121579A JP2005312026A JP2005312026A JP2007121579A JP 2007121579 A JP2007121579 A JP 2007121579A JP 2005312026 A JP2005312026 A JP 2005312026A JP 2005312026 A JP2005312026 A JP 2005312026A JP 2007121579 A JP2007121579 A JP 2007121579A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- voice
- user
- trigger
- command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000001514 detection method Methods 0.000 claims description 33
- 230000005540 biological transmission Effects 0.000 description 9
- 210000003811 finger Anatomy 0.000 description 8
- 238000000034 method Methods 0.000 description 4
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 210000003414 extremity Anatomy 0.000 description 2
- 210000005224 forefinger Anatomy 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 210000003813 thumb Anatomy 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 210000001747 pupil Anatomy 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Landscapes
- Selective Calling Equipment (AREA)
Abstract
Description
本発明は、入力された音声に従って操作対象となる機器を操作する操作装置に関するものである。 The present invention relates to an operating device that operates a device to be operated according to an input voice.
従来から、この種の操作装置として、音声を電気信号からなる音声信号に変換する音声入力手段(マイクロフォン)と、予め登録された命令のうちで前記音声の意味に一致する命令があるか否かを音声信号に基づいて判定する音声認識手段(音声認識処理回路)と、音声認識手段で音声の意味に命令が一致すると判定された場合には当該命令に対応する命令信号を生成するコントローラとを備えたものが提供されている。生成された命令信号は送信装置から操作対象とする機器に伝送され、これにより機器が命令信号に従って操作される(たとえば特許文献1参照)。 Conventionally, as this type of operation device, there is a voice input means (microphone) for converting voice into a voice signal composed of an electrical signal, and whether there is a command that matches the meaning of the voice among pre-registered commands. A speech recognition means (speech recognition processing circuit) for determining the command based on the speech signal, and a controller that generates a command signal corresponding to the command when the speech recognition means determines that the command matches the meaning of the speech. What you have is provided. The generated command signal is transmitted from the transmission device to a device to be operated, and the device is operated according to the command signal (see, for example, Patent Document 1).
特許文献1に記載された操作装置では、操作対象が空気調和機であって、たとえば「強く」という音声が入力されることによって、送風が強くなるように空気調和機を操作する。これにより、使用者による手動操作を必要とすることなく、音声のみで機器を操作することができる。
しかし、特許文献1に記載された操作装置では、使用者が機器を操作しようと意図して発生した音声以外の音声であっても、音声の意味が命令に一致すると機器を操作してしまうことになるので、人同士の会話の中に命令と意味が一致する音声(たとえば「強く」など)が含まれていると、この音声に反応して誤って機器を操作してしまうことがある。すなわち、使用者が機器を操作する意図で発生した音声以外の音声に反応することにより、使用者の意図しない操作が為されてしまうことがある。
However, in the operation device described in
本発明は上記事由に鑑みて為されたものであって、使用者が機器を操作する意図で発生した音声にのみ反応して機器を操作できる操作装置を提供することを目的とする。 The present invention has been made in view of the above reasons, and an object of the present invention is to provide an operating device capable of operating a device in response to only a sound generated by a user intending to operate the device.
請求項1の発明は、音声を電気信号である音声信号に変換する音声入力手段と、音声入力手段に入力された音声の意味が予め登録された命令に一致しているか否かを前記音声信号に基づいて判定する音声認識手段と、音声認識手段で音声の意味が命令に一致していると判定されると当該命令に従って操作対象である機器を操作する操作手段と、使用者からの所定の合図を検出する検出手段を有し当該検出手段で前記合図を検出したときにトリガ信号を出力するトリガ手段とを備え、トリガ信号が出力された後の所定の受付期間に音声入力手段に入力された音声の意味が命令に一致した場合にのみ機器を操作することを特徴とする。 According to the first aspect of the present invention, there is provided a voice input means for converting voice into a voice signal that is an electrical signal, and whether or not the meaning of the voice inputted to the voice input means matches a pre-registered command. A voice recognition unit that is determined based on the command, an operation unit that operates the device to be operated in accordance with the command when the voice recognition unit determines that the meaning of the voice matches the command, and a predetermined value from the user And a trigger unit that outputs a trigger signal when the signal is detected by the detection unit, and is input to the voice input unit during a predetermined reception period after the trigger signal is output. The device is operated only when the meaning of the voice matches the command.
この構成によれば、操作装置は、受付期間に音声入力手段に入力された音声の意味が命令に一致した場合にのみ機器を操作するので、受付期間以外の期間においては、如何なる音声が音声入力手段に入力されたとしても機器の操作を行うことはない。一方、受付期間はトリガ手段が使用者からの所定の合図を検出手段で検出してトリガ信号を出力した後に設定されるので、使用者が合図を送ることによって受付期間を開始させることができ、言い換えると、使用者が合図を送らない限り受付期間が開始されることはない。すなわち、請求項1の発明は、使用者が合図を送ることによってはじめて音声による機器の操作が可能になるものであるから、使用者が機器を操作することを意図しておらず合図が送られていない状態では、たとえば人同士の会話の中に命令と意味が一致する音声が含まれていたとしても、この音声に反応して誤って機器を操作してしまうことはない。したがって、使用者が機器を操作する意図で発生した音声にのみ反応して機器を操作することができるという利点がある。また、受付期間は使用者からの合図を検出した後に設定されるので、使用者からの合図が一旦検出されて受付期間が開始すると、この受付期間内においては、使用者は改めて合図を送ることなく音声による機器の操作を行うことができる。すなわち機器を操作する際の手順が簡単である。
According to this configuration, the operating device operates the device only when the meaning of the voice input to the voice input unit in the reception period matches the command. Therefore, any voice is input during the period other than the reception period. Even if it is input to the means, the device is not operated. On the other hand, since the reception period is set after the trigger means detects a predetermined signal from the user by the detection means and outputs a trigger signal, the reception period can be started by the user sending a signal, In other words, the acceptance period will not start unless the user sends a signal. In other words, the invention of
請求項2の発明は、請求項1の発明において、前記検出手段が使用者の視線を検出する視線検出部を備えており、前記合図は使用者の視線が特定方向に向けられることであることを特徴とする。 According to a second aspect of the present invention, in the first aspect of the invention, the detecting means includes a line-of-sight detection unit that detects the line of sight of the user, and the cue is that the line of sight of the user is directed in a specific direction. It is characterized by.
この構成によれば、使用者が前記特定方向に視線を向けるだけで音声による機器の操作が可能になるので、使用者は手足を動かすことなく機器を操作することができる。 According to this configuration, since the user can operate the device by voice only by directing his / her line of sight in the specific direction, the user can operate the device without moving the limbs.
請求項3の発明は、請求項1の発明において、前記検出手段が音を検出するマイクロホンを備えており、前記合図が特定の音であることを特徴とする。
The invention of
この構成によれば、使用者が前記特定の音を発生するだけで機器の操作が可能になるので、暗い室内で機器を操作する場合や、使用者が視覚障害者である場合でも簡単に機器を操作することができる。 According to this configuration, since the user can operate the device only by generating the specific sound, the device can be easily operated even when operating the device in a dark room or when the user is visually impaired. Can be operated.
請求項4の発明は、請求項1の発明において、前記検出手段が使用者を撮影するカメラと、カメラで撮影された画像から使用者の身振りを検出する画像処理部とを備えており、前記合図が使用者の特定の身振りであることを特徴とする。 According to a fourth aspect of the present invention, in the first aspect of the invention, the detection unit includes a camera that captures the user, and an image processing unit that detects the gesture of the user from the image captured by the camera. The cue is a specific gesture of the user.
この構成によれば、使用者が前記特定の身振りを行うだけで機器の操作が可能になるので、暗い室内で機器を操作する場合や、使用者が視覚障害者である場合でも簡単に機器を操作することができる。なお、ここでいう身振りとは、たとえば使用者が片手の人差し指と中指とをV字状に開きその他の指を曲げた所謂ピースサインや、片手の親指と人差し指とで輪をつくりその他の指を広げた所謂オーケーサイン等の特定のサインをつくってこれらのサインをカメラに向けること、また使用者が身体全体を使って特定のポーズをとることなどを意味している。 According to this configuration, since the user can operate the device only by performing the specific gesture, the device can be easily operated even when operating the device in a dark room or when the user is visually impaired. Can be operated. Gesture here refers to, for example, a so-called peace sign in which the user opens the forefinger and middle finger of one hand in a V shape and bends the other fingers, or creates a ring with the thumb and forefinger of one hand and other fingers. It means that specific signs such as spread so-called okay signs are created and these signs are directed to the camera, and the user takes a specific pose using the whole body.
請求項5の発明は、請求項1ないし請求項4のいずれかの発明において、前記トリガ手段が、前記検出手段を複数有しており、全ての検出手段で前記合図を検出したときに前記トリガ信号を出力することを特徴とする。
The invention of
この構成によれば、複数の検出手段の全てにおいて合図が検出されてはじめて、受付期間が開始し音声による機器の操作が可能になるので、仮に1つの検出手段で合図が誤って検出されたとしても、残りの検出手段で合図が検出されない限り、音声による機器の操作が可能になることはない。したがって、使用者が機器の操作を意図しない状態で受付期間が誤って開始してしまうことを回避でき、使用者が機器を操作する意図で発生した音声以外の音声による誤操作を確実に回避できるという利点がある。 According to this configuration, since the reception period starts and the device can be operated by voice only after the signal is detected in all of the plurality of detection means, it is assumed that the signal is erroneously detected by one detection means. However, as long as the signal is not detected by the remaining detection means, the device cannot be operated by voice. Therefore, it is possible to prevent the reception period from being erroneously started in a state where the user does not intend to operate the device, and it is possible to reliably avoid erroneous operation due to sound other than the sound generated by the user intending to operate the device. There are advantages.
請求項6の発明は、請求項1ないし請求項5のいずれかの発明において、前記操作手段が、無線信号を用いて前記機器に対して前記命令を伝送することを特徴とする。 According to a sixth aspect of the present invention, in any one of the first to fifth aspects, the operation means transmits the command to the device using a radio signal.
この構成によれば、操作装置と操作対象である機器との間に電線を引き回す必要がないから、操作装置あるいは機器の設置時の配線作業が簡単になる。なお、ここでいう無線信号には、たとえば赤外線通信により伝送される信号や、電波を搬送波として伝送される信号などを含む。 According to this configuration, since it is not necessary to route an electric wire between the operating device and the device to be operated, wiring work at the time of installing the operating device or the device is simplified. The radio signal here includes, for example, a signal transmitted by infrared communication, a signal transmitted using radio waves as a carrier wave, and the like.
本発明は、トリガ手段が使用者からの合図を検出手段で検出することによってはじめて音声による機器の操作を可能とするものであるから、使用者が機器を操作することを意図しておらず合図が送られていない状態では、たとえば人同士の会話の中に命令と意味が一致する音声が含まれていたとしても、この音声に反応して誤って機器を操作してしまうことはない。したがって、使用者が機器を操作する意図で発生した音声にのみ反応して機器を操作することができるという利点がある。 According to the present invention, since the trigger means detects the signal from the user by the detection means, the device can be operated by voice only. Therefore, the user does not intend to operate the device. If no voice is sent, for example, even if a voice whose meaning matches the command is included in a conversation between people, the device will not be operated by mistake in response to the voice. Therefore, there is an advantage that the device can be operated only in response to the sound generated by the user intending to operate the device.
本実施形態の操作装置は、使用者が発生する音声に従って操作対象としての機器を操作するものであって、図2に示すように、使用者Uが室内に設置されたベッドB上に仰向けに横たわった姿勢で機器を操作できるようにベッドBの頭部側付近の壁面に設置された装置本体1を備えている。本実施形態では、装置本体1と同室内に設置されたエアコン(空気調節装置)Aおよびテレビ(テレビジョン受像機)TVを操作対象とした例を示す。
The operating device according to the present embodiment operates a device as an operation target in accordance with a voice generated by a user. As shown in FIG. 2, the user U lies on a bed B installed indoors. The apparatus
以下ではまず、入力された音声に従って操作対象であるエアコンAおよびテレビTVの操作を行うための構成について図1を参照して説明する。 In the following, first, a configuration for operating the air conditioner A and the television TV, which are operation targets, according to the input voice will be described with reference to FIG.
装置本体1は、音声を電気信号からなる音声信号に変換して出力する音声入力手段としてのマイクロホン2と、マイクロホン2からの音声信号を受ける制御回路とを備えている。マイクロホン2は、使用者UがベッドB上に仰向けに横たわった姿勢で発生する音声が到達しやすい位置に設置されている。制御回路には、音声信号に基づいて音声認識を行う音声認識手段3と、音声認識手段3の出力に従ってエアコンAおよびテレビTVを操作する操作手段4とが設けられている。
The apparatus
音声認識手段3は、音声信号から音韻・韻律を含む入力音声の特徴パラメータを取り出すためのデータが予め格納された音響モデル格納部5と、取り出された特徴パラメータに基づいて入力音声に含まれる単語を取り出すためのデータが予め格納された言語モデル・辞書格納部6と、音響モデル格納部5および言語モデル・辞書格納部6を用いて入力音声の意味を理解し、入力音声の意味が予め登録されている命令に一致するか否かを判定する音声認識部7とで構成される。ここでは、「電源オン」、「電源オフ」などエアコンAおよびテレビTVの操作に用いられる複数種類の命令が登録されている。
The speech recognition means 3 includes an acoustic
ここにおいて、音声認識部7は、入力された音声の意味と一致する命令があればこの命令を後述する送信部8と共に操作手段4を構成する操作司令部9に出力し、一方、一致する命令がなければ出力は行わない。ただし、入力された音声の意味と命令との両者が完全に一致していなくとも、両者の類似度が閾値を超えることにより両者が一致するものと判定する構成であればよく、類似度に対する閾値は、誤った命令を出力する誤認識と命令の出力を行わない不認識とのバランスを考慮し、操作装置としての動作に支障がないように設定することが望ましい。
Here, if there is a command that matches the meaning of the input voice, the
操作司令部9は、音声認識部7から命令を受けてこの命令に対応する操作信号を生成する。このように生成された操作信号は、操作司令部9の後段の送信部8に出力され、送信部8からエアコンAあるいはテレビTVに対して送信される。そして、エアコンAおよびテレビTVは、送信部8からの操作信号を受けると当該操作信号に従って動作する。エアコンAの操作とテレビTVの操作との区別は、音声認識手段3において、先頭に「エアコン」という単語が付与された音声をエアコンAの操作に関するものと認識し、先頭に「テレビ」という単語が付与された音声をテレビTVの操作に関するものと認識することにより行っている。すなわち、操作装置は、たとえば「エアコンを28度に設定」という音声が入力されると、エアコンAの設定温度を28度に設定する操作を行い、一方、たとえば「テレビの音量を下げる」という音声が入力されると、テレビTVの音量を下げる操作を行う。
The operation command unit 9 receives a command from the
本実施形態では、送信部8がエアコンA、テレビTVの各々に設けられた赤外線リモコン用の受光部(図示せず)に向けて赤外線をそれぞれ送信する構成を採用することにより、赤外線通信で操作信号を伝送するようにしている。すなわち、操作装置からの命令は無線信号である操作信号を用いて機器に伝送されることになる。ここで、エアコンAを操作する各操作信号としては、エアコンAの専用の赤外線リモコン(図示せず)から各種の操作時に送信されるリモコン信号と同じ信号をそれぞれ用いており、テレビTVを操作する各操作信号としては、テレビTVの専用の赤外線リモコン(図示せず)から各種の操作時に送信されるリモコン信号と同じ信号をそれぞれ用いている。
In the present embodiment, the
なお、ここでは無線信号を用いて命令を伝送する例を示したが、操作対象になる機器と送信部8とを有線接続しておいて命令を有線で伝送するようにしてもよい。一例として、壁内を通して送信部8と機器とを有線接続することができ、この場合に装置本体1においては周知の埋込型配線器具と同様に一部が壁内に埋設される構成を採用することもできる。また、壁面に予め設置されたスイッチによって操作される機器(たとえば照明器具)を操作対象とする場合には、音声認識部7からの命令に従って開閉するリレー(図示せず)を設けた装置本体1を採用し、既設のスイッチをこの装置本体1に取り換えるとともにスイッチ用の先行配線を利用して装置本体1と機器とを接続するだけで、装置本体1のリレーで機器を操作することができるようになる。
Although an example in which a command is transmitted using a wireless signal is shown here, the command may be transmitted in a wired manner by connecting the device to be operated and the
ところで、本実施形態では、上述したように、マイクロホン2に入力された音声に従ってエアコンAやテレビTVを操作する期間を、所定の受付期間のみに限定している。つまり、受付期間以外の期間には、いずれかの命令に対応する音声がマイクロホン2に入力されたとしても、当該音声に従ってエアコンAやテレビTVを操作することはない。ここでは、受付期間は操作司令部9によって規定されており、操作司令部9は後述するトリガ信号を受けた後の所定の期間を受付期間と規定する。
By the way, in this embodiment, as described above, the period for operating the air conditioner A and the TV TV according to the sound input to the
ここで、受付期間を開始するタイミングを決定するために、使用者Uからの所定の合図を検出し、合図が検出されると操作司令部9に対してトリガ信号を出力するトリガ手段10が設けられている。本実施形態のトリガ手段10は、使用者Uの視線を検出する検出手段を有し、検出手段で視線が特定方向に向けられたことを検出するとトリガ信号を出力する。ここでは、前記特定方向を装置本体1に設けた後述のビデオカメラ11の方向としており、装置本体1のビデオカメラ11に使用者Uの視線が向けられることによってトリガ信号を出力する。なお、図1ではトリガ信号を出力する機能を検出手段に設け、検出手段のみでトリガ手段10を構成しているが、検出手段とトリガ信号を出力する手段とを別々に有していてもよい。
Here, in order to determine the timing for starting the reception period, there is provided trigger means 10 for detecting a predetermined signal from the user U and outputting a trigger signal to the operation command section 9 when the signal is detected. It has been. The trigger means 10 of this embodiment has a detection means for detecting the line of sight of the user U, and outputs a trigger signal when the detection means detects that the line of sight is directed in a specific direction. Here, the specific direction is a direction of a video camera 11 (described later) provided in the apparatus
具体的に説明すると、トリガ手段10は使用者Uの顔面を撮影できるように装置本体1に設けられたビデオカメラ11と、ビデオカメラ11から出力される画像信号に対して前処理を実行する画像信号処理部12と、画像信号処理部12の出力を受けて使用者Uの視線がビデオカメラ11に向けられているか否かを検出する視線検出部15とで構成されている。視線検出部15には、たとえば使用者Uの瞳孔の形状を抽出し、瞳孔の形状が円形になるとビデオカメラ11に視線が向けられていると判断する技術が適用される。画像信号処理部12と視線検出部15とは制御回路に設けられている。
Specifically, the trigger means 10 is a
視線検出部15は視線が装置本体1のビデオカメラ11に向けられたことを検出するとトリガ信号を出力する。ただし、視線検出部15は、ビデオカメラ11に視線が一瞬だけ向けられた場合にはトリガ信号を出力せずに、ビデオカメラ11に視線が所定時間連続して向けられたとき、つまりビデオカメラ11が注視されたときにトリガ信号を出力するように構成される。操作司令部9は、トリガ信号を受けた後に受付期間を開始し、一定時間が経過すると受付期間を終了する。そして、操作司令部9は、受付期間にのみ音声認識部7からの命令を有効とする受付状態で動作し、受付期間以外の期間には音声認識部7からの命令を無効とする待機状態で動作する。つまり、操作司令部9では、受付期間に命令を受けた場合にのみ操作信号を生成することになる。ここでは、音声認識部7は操作司令部9からの信号を受けることによって、受付期間にのみ音声認識の処理を行うように構成されている。
The line-of-sight detection unit 15 outputs a trigger signal when detecting that the line of sight is directed to the
なお、前記特定方向を操作対象である機器(エアコンAまたはテレビTV)の方向とし、トリガ手段10において使用者Uの視線が機器に向けられたことを検出するとトリガ信号を出力する構成としてもよい。この構成では、使用者Uは操作対象である機器の動作状態を目で確認しながら機器を操作することができるから、たとえば機器の電源が入っていない状態ではまず機器の電源をオンする操作を行うなど、機器の動作状態に応じた操作が容易になる。さらに、この構成では使用者Uが操作しようとする機器を注視することによりこの機器の操作が可能となるので、機器とは関係のない装置本体1のビデオカメラ11を注視することにより機器の操作を可能とする構成に比べて、直観的な操作ができるようになる。
The specific direction may be the direction of the device to be operated (air conditioner A or TV TV), and a trigger signal may be output when the trigger means 10 detects that the line of sight of the user U is directed to the device. . In this configuration, the user U can operate the device while visually confirming the operation state of the device to be operated. For example, when the device is not turned on, the user U first turns on the device. This makes it easy to perform operations according to the operating state of the device. Further, in this configuration, since the user U can operate the device by gazing at the device to be operated, the device operation can be performed by gazing at the
以下、本実施形態の操作装置の動作を、操作手段の動作を表す図3のフローチャートを参照して簡単に説明する。 Hereinafter, the operation of the operation device of the present embodiment will be briefly described with reference to the flowchart of FIG. 3 showing the operation of the operation means.
まず、操作司令部9は待機状態に設定され(ステップS01)、トリガ信号が入力されるまでの期間(受付期間以外の期間)においては、待機状態で動作し続ける。したがって、この期間に、たとえば「エアコンを28度に設定」という命令に対応する音声(「エアコンを28度に設定」)がマイクロホン2に入力されたとしても、操作装置が機器の操作を行うことはない。一方、使用者Uがビデオカメラ11を注視してビデオカメラ11に視線が向けられると、トリガ手段10からのトリガ信号が操作司令部9に入力されることになり(ステップS02:Y)、その後、操作司令部9は受付状態に移行する(ステップS03)とともに、受付期間を規定するタイマ時間Tの時限を開始する(ステップS04)。受付期間内においては、たとえば「エアコンを28度に設定」という音声がマイクロホン2に入力されると、この音声の意味に一致する命令として「エアコンを28度に設定」という命令が操作司令部9に入力され(ステップS05:Y)、設定温度を28度に設定するようにエアコンAを操作する操作信号が操作司令部9で生成される(ステップS08)。生成された操作信号は送信部8からエアコンAに送信され(ステップS09)、エアコンAは受信した操作信号に従って設定温度を28度に設定することになる。
First, the operation command unit 9 is set to a standby state (step S01), and continues to operate in the standby state during a period until a trigger signal is input (a period other than the reception period). Therefore, during this period, for example, even if a voice corresponding to the command “Set the air conditioner to 28 degrees” (“Set the air conditioner to 28 degrees”) is input to the
また、受付期間はタイマ時間Tが一定時間Tcを時限している間に設定されているから、受付期間内に音声が入力されなければ、受付期間の終了時点(ステップS07:Y)で操作司令部9は待機状態に移行する(ステップS01)。ただし、受付期間の途中で音声認識部7から操作司令部9に命令が出力されると、操作司令部9は命令を受け取った時点で受付期間を終了する。
Further, since the reception period is set while the timer time T is limited to the fixed time Tc, if no sound is input within the reception period, the operation command is given at the end of the reception period (step S07: Y). The unit 9 shifts to a standby state (step S01). However, when a command is output from the
上述した構成によれば、使用者Uは、ベッドB上に横たわった姿勢のままで手足を動かすことなく操作装置によってエアコンAおよびテレビTVを操作することができる。ただし、マイクロホン2に対して受付期間以外の期間にいずれかの命令に対応する音声(たとえば「テレビの電源をいれる」など)が入力されても、操作装置が機器(エアコンAおよびテレビTV)の操作を行うことはなく、受付期間以外の期間に、たとえば人同士の会話中の「テレビの電源をいれる」という音声がマイクロホン2に入力されたとしても、操作装置がこの音声に反応して機器を操作してしまうことはない。したがって、操作装置は、使用者UがエアコンAやテレビTVを操作する意図で発生した音声にのみ反応してエアコンAやテレビTVを操作することになり、使用者Uが意図しない操作を回避することができる。
According to the configuration described above, the user U can operate the air conditioner A and the TV TV by the operation device without moving the limbs while keeping the posture lying on the bed B. However, even if a sound corresponding to any command (for example, “turn on the TV”) is input to the
また、図1に示すように、操作司令部9には制御回路に設けた出力制御部16を介してスピーカ17およびランプ18が接続されており、本実施形態ではこのスピーカ17とランプ18と出力制御部16とを、受付期間であることを使用者Uに通知する通知手段19として用いている。すなわち、受付期間が開始すると、操作司令部9は出力制御部16を介してランプ18を点灯させるとともに、スピーカ17から所定の音声(たとえば「ご用件をどうぞ」など)を音声合成により出力させることによって、使用者Uに対して受付期間であるということを光および音声で通知する。これにより、使用者Uに音声の発生を促すことができる。さらに、万一、使用者Uの意図に関係なく受付期間が開始してしまった場合には、使用者Uに対してエアコンAやテレビTVの誤操作につながる音声を発生しないように注意を促すことができる。
As shown in FIG. 1, a
ところで、トリガ手段10の構成としては、上述したように使用者Uの視線が特定方向に向けられたことを検出してトリガ信号を出力する構成に限るものではなく、他の例として、たとえば以下に説明する構成を採用することもできる。 By the way, the configuration of the trigger means 10 is not limited to the configuration in which the user U's line of sight is directed in a specific direction and outputs a trigger signal as described above. It is also possible to adopt the configuration described in (1).
すなわち、検出手段にマイクロホンを備え、このマイクロホンに特定の音が入力されることによりトリガ信号を出力するようにトリガ手段10を構成する。ここでは口笛の音を特定の音とするが、口笛に限らず、舌打ちや拍手、あるいは規定の音声(たとえば「音声操作」など)等を特定の音としてもよい。ただし、特定の音が入力されると受付期間が開始され、入力された音声に従ってエアコンAおよびテレビTVを操作する状態となるので、前記規定の音声は日常会話で頻発される音声を避けることが望ましい。 That is, the trigger means 10 is configured to include a microphone in the detection means and to output a trigger signal when a specific sound is input to the microphone. Although the whistling sound is a specific sound here, not only the whistling, but also a specific sound such as tongue hitting, applause, or a specified voice (for example, “voice operation”) may be used. However, since a reception period starts when a specific sound is input and the air conditioner A and the TV TV are operated according to the input sound, the prescribed sound avoids a sound frequently generated in daily conversation. desirable.
規定の音声を検出してトリガ信号を出力する構成とする場合には、図1に示した音声入力手段としてのマイクロホン2を検出手段のマイクロホンとして利用するとともに、上記規定の音声を認識するとトリガ信号を出力するように音声認識手段3を構成することが望ましい。これにより、音声入力手段および音声認識手段3をトリガ手段として流用することができるので、トリガ手段として専用の構成を付加することなくトリガ手段としての機能を実現することができる。ただしこの場合には、受付期間以外の期間でも音声認識の処理を行うように音声認識手段3を構成する必要がある。
In the case of a configuration in which a prescribed sound is detected and a trigger signal is output, the
また、視線が特定方向に向けられたか否かの検出結果と、特定の音が検出されたか否かの検出結果との論理積をとってトリガ信号を出力するようにしてもよい。具体的には、操作司令部9の前段に論理積回路(図示せず)を設け、視線が特定方向に向けられたか否かの検出結果および特定の音が検出されたか否かの検出結果を論理積回路の入力とし、論理積回路の出力をトリガ信号とする。この構成では、視線が特定方向に向けられ、かつ特定の音が検出されることによってはじめてトリガ信号が出力され、受付期間を開始することになるから、特定方向に向けられた視線と特定の音とのいずれか一方のみが検出されたとしても受付期間が開始することはない。結果的に、使用者Uの意図に反して受付期間が開始されてしまうことを回避できるという効果を奏する。 Further, the trigger signal may be output by taking the logical product of the detection result of whether or not the line of sight is directed in a specific direction and the detection result of whether or not the specific sound is detected. Specifically, a logical product circuit (not shown) is provided in the front stage of the operation command unit 9 to detect whether the line of sight is directed in a specific direction and whether the specific sound is detected. The input of the logical product circuit is used, and the output of the logical product circuit is used as the trigger signal. In this configuration, since the trigger signal is output and the reception period starts only when the line of sight is directed in a specific direction and a specific sound is detected, the line of sight directed in the specific direction and the specific sound are started. Even if only one of these is detected, the acceptance period does not start. As a result, there is an effect that it is possible to avoid the start of the reception period against the intention of the user U.
あるいは、たとえば使用者Uの上半身を撮影できるように装置本体1に設けられたビデオカメラと、ビデオカメラの画像から使用者Uの身振りを検出する画像処理部とを検出手段に備え、使用者Uが特定の身振りを行ったことを検出するとトリガ信号を出力するようにトリガ手段10を構成することもできる。ここでは使用者Uが、片手の人差し指と中指とをV字状に開きその他の指を曲げた所謂ピースサインを装置本体1に向けることを特定の身振りとしている。画像処理部においては、使用者Uがビデオカメラに向けてピースサインをしたときの使用者Uの手の輪郭形状を標準パターンとして予め登録しておき、ビデオカメラで撮影された使用者Uの手の輪郭形状が標準パターンに一致すると使用者Uがピースサインをしていると判断する。なお、特定の身振りはピースサインに限るものではないが、たとえば片手の親指と人差し指とで輪をつくりその他の指を広げた所謂オーケーサインなど、ベッドB上に仰向けに横たわった姿勢の使用者Uがほとんど身体を動かすことなく行えるものとすることが望ましい。
Alternatively, for example, the detection unit includes a video camera provided in the apparatus
2 マイクロホン(音声入力手段)
3 音声認識手段
4 操作手段
10 トリガ手段
15 視線検出部
A エアコン(機器)
TV テレビ(機器)
U 使用者
2 Microphone (voice input means)
3 Voice recognition means 4 Operation means 10 Trigger means 15 Line-of-sight detection part A Air conditioner (device)
TV TV (equipment)
U user
Claims (6)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005312026A JP2007121579A (en) | 2005-10-26 | 2005-10-26 | Operation device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005312026A JP2007121579A (en) | 2005-10-26 | 2005-10-26 | Operation device |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2007121579A true JP2007121579A (en) | 2007-05-17 |
Family
ID=38145503
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2005312026A Withdrawn JP2007121579A (en) | 2005-10-26 | 2005-10-26 | Operation device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2007121579A (en) |
Cited By (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007142957A (en) * | 2005-11-21 | 2007-06-07 | National Institute Of Information & Communication Technology | Remote dialogue method and apparatus |
| JP2009122598A (en) * | 2007-11-19 | 2009-06-04 | Pioneer Electronic Corp | Electronic device, control method of electronic device, speech recognition device, speech recognition method and speech recognition program |
| CN101841652A (en) * | 2009-03-13 | 2010-09-22 | 奥林巴斯映像株式会社 | Camera head and camera |
| JP2011015090A (en) * | 2009-06-30 | 2011-01-20 | Fujitsu Ltd | Telephone device, communication control method and communication control program |
| WO2011055410A1 (en) * | 2009-11-06 | 2011-05-12 | 株式会社 東芝 | Voice recognition device |
| JP2012133243A (en) * | 2010-12-22 | 2012-07-12 | Toshiba Corp | Speech recognition device, speech recognition method, and television receiver having speech recognition device mounted thereon |
| JP2012185861A (en) * | 2012-07-03 | 2012-09-27 | Toshiba Corp | Operation device and operation method |
| JP2012220959A (en) * | 2011-04-08 | 2012-11-12 | Sony Computer Entertainment Inc | Apparatus and method for determining relevance of input speech |
| CN103002214A (en) * | 2011-09-09 | 2013-03-27 | 奥林巴斯映像株式会社 | Camera shooting device and camera shooting method |
| JP2013080015A (en) * | 2011-09-30 | 2013-05-02 | Toshiba Corp | Speech recognition device and speech recognition method |
| JP2013145333A (en) * | 2012-01-16 | 2013-07-25 | Mitsubishi Electric Corp | Air-conditioning equipment control adapter and air-conditioning equipment |
| KR101396633B1 (en) * | 2008-06-10 | 2014-05-16 | 삼성전자주식회사 | Apparatus and method for controlling function of image out using sound signal |
| JP2017009867A (en) * | 2015-06-24 | 2017-01-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | Control apparatus, control method thereof, and program |
| JP2017007652A (en) * | 2015-06-08 | 2017-01-12 | ロベルト・ボッシュ・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツングRobert Bosch Gmbh | Method for recognizing context for language control, method for determining a language control signal for language control, and apparatus for implementing the method |
| JP2017054065A (en) * | 2015-09-11 | 2017-03-16 | 株式会社Nttドコモ | Dialogue device and dialogue program |
| JP2017173720A (en) * | 2016-03-25 | 2017-09-28 | パイオニア株式会社 | Speech recognition apparatus and method, computer program, and recording medium |
| WO2018211619A1 (en) * | 2017-05-17 | 2018-11-22 | 三菱電機株式会社 | Air conditioning control device, air conditioning system, and air conditioning control method and program |
-
2005
- 2005-10-26 JP JP2005312026A patent/JP2007121579A/en not_active Withdrawn
Cited By (25)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007142957A (en) * | 2005-11-21 | 2007-06-07 | National Institute Of Information & Communication Technology | Remote dialogue method and apparatus |
| JP2009122598A (en) * | 2007-11-19 | 2009-06-04 | Pioneer Electronic Corp | Electronic device, control method of electronic device, speech recognition device, speech recognition method and speech recognition program |
| KR101396633B1 (en) * | 2008-06-10 | 2014-05-16 | 삼성전자주식회사 | Apparatus and method for controlling function of image out using sound signal |
| US8384794B2 (en) | 2009-03-13 | 2013-02-26 | Olympus Imaging Corp. | Image sensing device and camera |
| CN101841652A (en) * | 2009-03-13 | 2010-09-22 | 奥林巴斯映像株式会社 | Camera head and camera |
| JP2011015090A (en) * | 2009-06-30 | 2011-01-20 | Fujitsu Ltd | Telephone device, communication control method and communication control program |
| CN102483918B (en) * | 2009-11-06 | 2014-08-20 | 株式会社东芝 | Voice recognition device |
| CN102483918A (en) * | 2009-11-06 | 2012-05-30 | 株式会社东芝 | Voice recognition device |
| JPWO2011055410A1 (en) * | 2009-11-06 | 2013-03-21 | 株式会社東芝 | Voice recognition device |
| WO2011055410A1 (en) * | 2009-11-06 | 2011-05-12 | 株式会社 東芝 | Voice recognition device |
| US8762145B2 (en) | 2009-11-06 | 2014-06-24 | Kabushiki Kaisha Toshiba | Voice recognition apparatus |
| JP2012133243A (en) * | 2010-12-22 | 2012-07-12 | Toshiba Corp | Speech recognition device, speech recognition method, and television receiver having speech recognition device mounted thereon |
| JP2012220959A (en) * | 2011-04-08 | 2012-11-12 | Sony Computer Entertainment Inc | Apparatus and method for determining relevance of input speech |
| CN103002214A (en) * | 2011-09-09 | 2013-03-27 | 奥林巴斯映像株式会社 | Camera shooting device and camera shooting method |
| JP2013080015A (en) * | 2011-09-30 | 2013-05-02 | Toshiba Corp | Speech recognition device and speech recognition method |
| JP2013145333A (en) * | 2012-01-16 | 2013-07-25 | Mitsubishi Electric Corp | Air-conditioning equipment control adapter and air-conditioning equipment |
| JP2012185861A (en) * | 2012-07-03 | 2012-09-27 | Toshiba Corp | Operation device and operation method |
| JP2017007652A (en) * | 2015-06-08 | 2017-01-12 | ロベルト・ボッシュ・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツングRobert Bosch Gmbh | Method for recognizing context for language control, method for determining a language control signal for language control, and apparatus for implementing the method |
| JP2017009867A (en) * | 2015-06-24 | 2017-01-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | Control apparatus, control method thereof, and program |
| JP2017054065A (en) * | 2015-09-11 | 2017-03-16 | 株式会社Nttドコモ | Dialogue device and dialogue program |
| JP2017173720A (en) * | 2016-03-25 | 2017-09-28 | パイオニア株式会社 | Speech recognition apparatus and method, computer program, and recording medium |
| WO2018211619A1 (en) * | 2017-05-17 | 2018-11-22 | 三菱電機株式会社 | Air conditioning control device, air conditioning system, and air conditioning control method and program |
| JPWO2018211619A1 (en) * | 2017-05-17 | 2019-11-07 | 三菱電機株式会社 | Air conditioning control device, air conditioning system, air conditioning control method, and program |
| JP2021169924A (en) * | 2017-05-17 | 2021-10-28 | 三菱電機株式会社 | Air conditioning control device, air conditioning system, air conditioning control method and program |
| JP7204840B2 (en) | 2017-05-17 | 2023-01-16 | 三菱電機株式会社 | Air-conditioning control device, air-conditioning system, air-conditioning control method and program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2007121579A (en) | Operation device | |
| US6937742B2 (en) | Gesture activated home appliance | |
| US20200092625A1 (en) | Smart device cover | |
| EP3413303B1 (en) | Information processing device, information processing method, and program | |
| CN102483918B (en) | Voice recognition device | |
| JP2017117371A (en) | Control method, control device, and program | |
| JP2020525850A (en) | Method, electronic device, home appliance network and storage medium | |
| KR102592769B1 (en) | Electronic device and operating method thereof | |
| JP2005284492A (en) | Voice operation device | |
| JP6350903B2 (en) | Operation assistance device and operation assistance method | |
| CN105049802B (en) | A kind of speech recognition law-enforcing recorder and its recognition methods | |
| JP2007121576A (en) | Voice operation device | |
| CN101241698A (en) | Voice control system and voice control method for automatically receiving voice | |
| US20200090663A1 (en) | Information processing apparatus and electronic device | |
| JP6586617B2 (en) | Speech recognition apparatus, method, and computer program | |
| US20230223019A1 (en) | Information processing device, information processing method, and program | |
| US20080169933A1 (en) | Sound control system with an automatic sound receiving function | |
| CN111487898A (en) | Voice-controlled electrical equipment with language type discrimination | |
| TWI756966B (en) | Video device and operation method thereof | |
| JP2007190620A (en) | Robot apparatus control apparatus and method | |
| WO2024135001A1 (en) | Remote control equipment and remote control method | |
| JP2024091246A (en) | Remote control device and remote control method | |
| JP2021043613A (en) | Switch system | |
| CN110612569A (en) | Information processing apparatus, electronic device, control method, and control program | |
| JP2010076086A (en) | Remote controller of robot in entertainment, and control method and control program thereof |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20090106 |