JP2012059121A - 眼鏡型表示装置 - Google Patents
眼鏡型表示装置 Download PDFInfo
- Publication number
- JP2012059121A JP2012059121A JP2010203125A JP2010203125A JP2012059121A JP 2012059121 A JP2012059121 A JP 2012059121A JP 2010203125 A JP2010203125 A JP 2010203125A JP 2010203125 A JP2010203125 A JP 2010203125A JP 2012059121 A JP2012059121 A JP 2012059121A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- data
- voice
- display device
- type display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Control Of Indicators Other Than Cathode Ray Tubes (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
【解決手段】周囲の音を受音して音信号に変換し視界を撮像する眼鏡型表示装置1は、撮像された視界の画像データから話者の顔画像データ及び顔特徴データの少なくとも一方を抽出し、その顔画像データ及び顔特徴データ並びに周囲の音の音信号の少なくとも一つに基づいて、話者の音声信号を特定して抽出する。また、前記話者の音声信号をテキストデータに変換し、そのテキストデータを、そのテキストデータの言語とは異なる他の言語のテキストデータに変換する。他の言語に翻訳されたテキストデータは視界内に重ねて表示される。
【選択図】図1
Description
この眼鏡型表示装置によれば、顔関連データ抽出手段で抽出された話者の顔画像データ及び顔特徴データの少なくとも一方に基づいて当該話者の方向を特定することができ、受音手段から出力される音信号が周囲の雑音を含んでいても、その音信号から、前記特定した話者の方向からの音声信号のみを特定して抽出することができる。このように周囲の雑音を含む音信号から特定の話者からの音声信号のみを抽出してテキストデータに変換し、その話者の音声のテキストデータを他の言語のテキストデータに変換し、視界内に重ねて表示することができる。
なお、前記話者の音声信号を特定して抽出する音声信号抽出手段は、前記受音手段で変換された音信号に含まれる音声信号を抽出し、その抽出した音声信号と前記話者の顔画像データ及び顔特徴データの少なくとも一方とに基づいて、前記話者の音声信号を特定するように構成してもよい。
この眼鏡型表示装置によれば、データベースに保存されている話者に固有の音声特徴データを用いて、話者の音声信号の抽出及びテキストデータへの変換の少なくとも一方を行うことにより、周囲の音情報からの特定の話者の音声信号の抽出の精度や、その音信号からテキストデータへ変換する音声認識の精度を更に高めることができる。
また、前記話者に固有の音声特徴データがデータベースに保存されていない場合に、前記音声特徴データ抽出手段で抽出された前記話者に固有の音声特徴データを、その話者の顔画像データ及び顔特徴データの少なくとも一方と話者を識別可能な識別データとに関連付けてデータベースに追加して保存することにより、当該話者について、その後に行う音声信号の抽出の精度や音声認識の精度を更に高めることができる。
なお、前記話者に固有の音声特徴データが前記データベースに既に保存されている場合は、その既に保存されている話者に固有の音声特徴データを更新したり、前記音声特徴データ抽出手段で抽出された前記話者に固有の音声特徴データをデータベースに追加したりしてもよい。また、前記話者に固有の音声特徴データが前記データベースに既に保存されている場合は、前記音声特徴データ抽出手段で抽出された音声特徴データの保存を行わないようにしてもよい。
この眼鏡型表示装置によれば、データベースに保存されている話者に固有の言語表現データを、話者の音声のテキストデータを他の言語のテキストデータへ変換する翻訳に用いることにより、翻訳の精度を更に高めることができる。
また、話者に固有の言語表現データがデータベースに保存されていない場合に、言語表現データ抽出手段で抽出された話者に固有の言語表現データを、その話者の顔画像データ及び顔特徴データの少なくとも一方と話者を識別可能な識別データとに関連付けてデータベースに保存することにより、当該話者について、その後に行う翻訳の精度を更に高めることができる。
なお、前記話者に固有の言語表現データが前記データベースに既に保存されている場合は、その既に保存されている話者に固有の言語表現データを更新したり、前記言語表現データ抽出手段で抽出された前記話者に固有の言語表現データをデータベースに追加したりしてもよい。また、前記話者に固有の言語表現データが前記データベースに既に保存されている場合は、前記言語表現データの保存を行わないようにしてもよい。
この眼鏡型表示装置によれば、話者の顔画像データ及び顔特徴データの少なくとも一方に基づいて判断した当該話者の表情の情報を、話者の音声のテキストデータを他の言語のテキストデータへ変換する翻訳に用いることにより、翻訳の精度を更に高めることができる。
この眼鏡型表示装置によれば、視界の中に複数の話者がいる場合に、任意のタイミングで話者を切り換えて翻訳結果を表示したり、複数の話者の翻訳結果を同時に表示したりすることができる。
この眼鏡型表示装置によれば、前記他の言語のテキストデータに変換された翻訳結果に問題がないと判断した場合に、その翻訳結果を当該利用者に固有の辞書データとしてデータベースに保存することにより、当該話者について、その後に行う翻訳の精度を更に高めることができる。
この眼鏡型表示装置によれば、前記翻訳結果に問題があると判断した場合に、前記他の言語のテキストデータへの変換のやり直しを行うことにより、誤った翻訳に基づいて話者との会話が進んでしまうのを回避することができる。また、前記翻訳結果に問題があると判断したときに、翻訳結果に問題があったことを話者に知らせるメッセージ及び問題があった翻訳結果の部分を話者に聞き直すメッセージの少なくとも一方を出力する場合、翻訳結果に問題があった部分を話者に対して聞き直すことができる。従って、この場合も、誤った翻訳に基づいて話者との会話が進んでしまうのを回避することができる。
この眼鏡型表示装置によれば、話者に対面して話者からの音声を聞いている利用者の眼の表情や動き、音声信号及びその音声信号から変換したテキストデータの少なくとも一つに基づいて、前記翻訳結果を検証することにより、翻訳結果の検証の精度を高めることができる。
本発明に係る翻訳システムは、前記通信手段を備えた眼鏡型表示装置と、前記データベースが設けられたサーバとを備える。
これらの眼鏡型表示装置及び翻訳システムによれば、眼鏡型表示装置のようなハードウェアなどの構成の制約が少ない外部のサーバに前記データベースを設けることにより、多数の話者について保存された話者に固有の顔画像データ、顔特徴データ、音声特徴データ、言語表現データ及び辞書データの少なくとも一つのデータを、多数の眼鏡型表示装置からアクセスして共有することができる。
前記翻訳システムにおいて、前記顔関連データ抽出手段、前記音声信号抽出手段、前記音声認識手段及び前記翻訳手段の少なくとも一つを、前記眼鏡型表示装置に備える代わりに前記サーバ装置に備えるように構成してもよい。
この眼鏡型表示装置によれば、前記視線方向検出手段で前記利用者の視線方向を検出するとともに、姿勢変化検出手段で検出された眼鏡型表示装置の姿勢変化の検出結果に基づいて、上記利用者の視線方向を速やかに補正することができる。これにより、視界撮像手段で撮像された視界画像内で利用者が注視している話者を特定するときの精度を高めることができる。
なお、前記眼鏡型表示装置において、前記視線方向検出手段は、前記利用者の眼を撮像する利用者撮像手段を有し、前記利用者撮像手段で撮像された前記利用者の眼の画像に基づいて前記利用者の視線方向を検出するものであってもよい。
また、前記眼鏡型表示装置において、前記視界撮像手段を前記視線方向検出手段として兼用してもよい。この場合は、前記視界撮像手段で撮像された画像内の所定位置(例えば、撮像画像の中心位置)の方向を前記視界における利用者の視線方向と推定される。
また、前記眼鏡型表示装置において、前記受音手段で受音された音声の音源方向を検出する音源方向検出手段を更に備えてもよい。この場合は、前記音源方向検出手段で検出された音声の音源方向に基づいて、話者をより精度よく特定することができる。
図1は、本発明の実施形態に係る眼鏡型表示装置1を含む翻訳システムの全体構成を示す説明図である。眼鏡型表示装置1は、利用者の両眼の前方を覆うように頭に装着することにより、利用者に話しかけた外国人の声と画像とを、通信ネットワーク40を介して翻訳サーバ50に送信し、翻訳サーバ50で翻訳したテキストデータを受信して、翻訳文を利用者が視認できるように前方視界に重ね合わせて表示することができる。
眼鏡型表示装置1のリム2又はテンプル3R,3Lの内部には、画像表示部12を構成する構成要素の少なくとも一部と、CPUやROM等で構成された制御手段としての制御部14と、記憶手段としてのメモリ15と、電源手段としてのバッテリ16と、装着検知部17とが格納されている。また、眼鏡型表示装置1は、通信部18と、姿勢変化検出部19とを更に備えている。
また、通信部18は、制御部14と連携することにより、前記特定された話者の画像データやマイク11で集音した音声データを翻訳サーバ50に送信するデータ送信手段として機能するとともに、翻訳サーバ50で翻訳した翻訳文のテキストデータを受信する翻訳データ受信手段としても機能する。
なお、姿勢変化検出部19は、加速度センサとともに又は加速度センサに代えて地磁気センサを備え、眼鏡型表示装置1に定義された座標を基準にして磁気センサで検出される方位情報を用いてに基づいて眼鏡型表示装置1の姿勢変化の検出するように構成してもよい。
利用者が注視しようとしている話者が同じであるにもかかわらず、何らかの理由により、眼鏡型表示装置1を装着している利用者の頭部に振動やふらつき等のぶれが発生する場合がある。利用者の頭部にぶれが発生すると、その頭部に装着した眼鏡型表示装置1の視界同調カメラ9で撮像される視界の画像における視線方向もぶれてしまうため、その撮像画像や視線方向に基づいて特定する利用者の話者の特定精度が低下するおそれがある。そこで、姿勢変化検出部19によって検出された眼鏡型表示装置の姿勢変化の検出結果に基づいて、視界同調カメラ9で撮像される視界の画像における視線方向を補正する制御を行うことにより、注視対象の特定精度を向上させることができる。
視界同調カメラ9で撮像した視界の画像の撮像及び視線方向の検出結果に基づく注視対象の特定処理を頻繁に実行すると、眼鏡型表示装置1における処理の負荷が大きくなってしまうおそれがある。そこで、眼鏡型表示装置1の姿勢が大きく変化したときに、その眼鏡型表示装置1を装着した利用者が注視している話者が変わった可能性が高い点に着目し、眼鏡型表示装置1の姿勢変化の検出結果(姿勢変化量)が、予め設定した閾値の範囲よりも大きくなったときに、視界同調カメラ9による視界の画像の撮像処理及び視線方向の検出処理を行うとともに、それらの視界の画像及び視線方向の検出結果に基づく話者の特定処理を行うように制御する。これにより、眼鏡型表示装置1における処理の負荷の増大を回避しつつ、利用者が注視している話者を特定できるようになる。
視界同調カメラ9による視界の画像の撮像処理や視線方向の検出処理が、眼鏡型表示装置1の姿勢変化(利用者の頭部の姿勢変化)に追従できない場合がある。この場合は、視界の撮像画像や視線方向に基づいて利用者の注視している話者をリアルタイムに特定することができなかったり、特定する利用者の注視している話者の特定精度が低下したりするおそれがある。そこで、視界同調カメラ9による視界の画像の撮像処理や視線方向の検出処理に必要な処理時間に基づいて、その撮像処理及び視線方向の検出処理を行うインターバルを予め設定しておく。そして、視界の撮像画像や視線方向に基づいて利用者の注視シテイル話者を特定した後、その後に到来する次の撮像・視線検出タイミングまでは、眼鏡型表示装置1の姿勢変化の検出結果に基づいて、直近の撮像済みの視界の画像及び検出済みの視線方向を補完することにより、話者を特定するように制御する。この制御により、話者の特定精度が低下することなく、利用者の注視している話者をリアルタイムに特定することができる。
図5において、制御部14から供給される画像信号を処理するための光源ユニット部110が設けられている。光源ユニット部110には、制御部14から翻訳文テキストデータの画像信号が入力され、それに基づいて画像を生成するための画像信号を発生する画像信号供給部111が設けられ、この画像信号供給部111から画像信号112、垂直同期信号113及び水平同期信号114が出力される。また、光源ユニット部110には、画像信号供給部111から伝達される画像信号112をもとに強度変調されたレーザ光を出射する光源としてのレーザ発振部115が設けられている。なお、前方視界に重ね合わせて表示する翻訳文の画像の形成位置を、利用者が注視している話者を見ているときの焦点位置に合わせるように、網膜に走査する像の焦点を調整する焦点距離調整手段を設けてもよい。
図6において、眼鏡型表示装置1には、視線同調カメラ9、視線検知部10、マイク11の他に、話者特定部20と音源分離部21とが設けられている。また、翻訳サーバ50には、音源分離部21で分離した音源の中から話者特定部20で特定した話者の音声を抽出する音声信号抽出手段としての特定音源抽出部22と、特定した話者の顔を認識する顔関連データ抽出手段としての顔認識部23と、特定した話者の音声を認識して話者の言語のテキストデータを作成する音声認識手段としての音声認識部24と、認識されたテキストデータを利用者の母国語に翻訳して翻訳文テキストデータを作成する翻訳手段としての自動翻訳部25とが設けられている。
図9において、翻訳サーバ50は、各部を制御する主制御部51と、顔画像を分析する画像分析エンジン52と、音声認識を行う音声認識エンジン53と、翻訳処理を行う翻訳エンジン54と、顔画像データ及び顔特徴データの少なくとも一方のデータを蓄積しておく画像分析用データベース55と、各国の言語に対応したテキストデータや個人ごとの声紋データを蓄積しておく音声識別用データベース56と、翻訳のための一般辞書データや個人辞書データを蓄積しておく翻訳用データベース57と、翻訳の対象となった話者ごとの対象話者ID等を蓄積しておく対象話者データベース58とを備えている。
なお、対象話者IDに関連付けて保存されている顔画像の特徴が変化している場合は、顔画像データや顔特徴データを更新するようにしてもよい。
図11において、利用者が外国人と会話しているときに自動翻訳がなされ、眼鏡型表示装置1には翻訳文が表示されている(ステップS1,S2)。相手方の話者との会話中に意味がわからない翻訳文が表示されたときに、利用者が、「Cannot understand.」という発言や、「ん?」という疑問的な声を発したときに、眼鏡型表示装置1は翻訳が不適切であり問題があると認識する(ステップS3でYes)。そして、直前の話者の発音を再度翻訳し、別の意味に翻訳し直した修正翻訳文を表示する(スッテプS4,S5)。利用者が再度疑問的な声を発しなければ(ステップS6でNo)、後の翻訳が正しいものとして、その修正パターンを検出し、話者の個人辞書データに、登録する(ステップS7,S8)。一方、利用者が再度疑問的な声を発した場合(ステップS6でYes)、再度翻訳を行い別の意味の翻訳文を表示する。ステップ8で修正パターンを登録した後、会話が続行しているか否かを判断し、会話が続行している場合(ステップS9でYes)、自動翻訳を続行する。会話が続行していない場合には終了となる。同様にステップS3で、利用者が疑問的な声を発しない場合も、会話が続行しているか否かを確認する(ステップS10)。
例えば、話者が「Catch you later.」と発音し、「あとであなたをつかまえろ」という翻訳がなされた場合に、利用者は意味がわからずに「ん?」と発したときに、「Catch you later.」を再度翻訳し、「またあとで」という別の意味に翻訳し直して表示する。利用者は意味が通じたので、会話を再開する。この翻訳し直した修正後の翻訳結果(修正パターン)は翻訳用データベース57の個人辞書データに蓄積される。
また、利用者が疑問的な声を発したときに、話者が別の言い回し方に言い換えてくれた音声を翻訳して表示し、修正パターンとして個人辞書データに蓄積してもよい。
図13は、複数の話者について同時に翻訳し同時に翻訳文を表示した一例の説明図である。図13において、3人の話者が発した音声が同時に翻訳されて、同時に表示される。なお、少なくとも翻訳文が表示されていればよく、原言語文は表示しなくてもよい。
2 リム
8 電源スイッチ
9 視界同調カメラ
10 視線検知部
11 マイク
12 画像表示部
14 制御部
15 メモリ
16 バッテリ
18 通信部
19 姿勢変化検出部
26 画像生成部
27 表示制御部
40 通信ネットワーク
50 翻訳サーバ
Claims (11)
- 周囲の音を受音して音信号に変換する受音手段と、視界を撮像する視界撮像手段と、視界内に情報を重ねて表示可能な表示手段とを備えた眼鏡型表示装置であって、
前記視界撮像手段で撮像された視界の画像データから話者の顔画像データ及び顔特徴データの少なくとも一方を抽出する顔関連データ抽出手段と、
前記顔関連データ抽出手段で抽出された前記話者の顔画像データ及び顔特徴データ並びに前記受音手段から出力される音信号の少なくとも一つに基づいて、前記話者の音声信号を特定して抽出する音声信号抽出手段と、
前記音声信号抽出手段で抽出された前記話者の音声信号をテキストデータに変換する音声認識手段と、
前記音声認識手段で認識された前記話者の音声のテキストデータを、そのテキストデータの言語とは異なる他の言語のテキストデータに変換する翻訳手段と、
前記翻訳手段で翻訳された前記他の言語のテキストデータを前記視界内に重ねて表示するように前記表示手段を制御する表示制御手段と、
を備えたことを特徴とする眼鏡型表示装置。 - 請求項1の眼鏡型表示装置において、
前記音声信号抽出手段で抽出された前記話者の音声信号に基づいて前記話者に固有の音声特徴データを抽出する音声特徴データ抽出手段と、
前記話者に固有の音声特徴データの有無をデータベースに照会する音声特徴データ照会手段と、
前記音声特徴データ照会手段の照会結果に基づき、前記話者に固有の音声特徴データが前記データベースに保存されていない場合は、前記音声特徴データ抽出手段で抽出された前記話者に固有の音声特徴データを、前記顔関連データ抽出手段で抽出された前記話者の顔関連データと前記話者を識別可能な識別データとに関連付けて前記データベースに保存する音声特徴データ保存手段と、を更に備え、
前記話者に固有の音声特徴データが前記データベースに保存されている場合は、前記データベースに保存されている前記話者に固有の音声特徴データを用いて、前記音声信号特定抽出手段による前記話者の音声信号の抽出及び前記音声認識手段による前記テキストデータへの変換の少なくとも一方を行うことを特徴とする眼鏡型表示装置。 - 請求項1又は2の眼鏡型表示装置において、
前記音声認識手段で認識された前記話者の音声のテキストデータに基づいて前記話者に固有の言語表現データを抽出する言語表現データ抽出手段と、
前記話者に固有の言語表現データの有無をデータベースに照会する言語表現データ照会手段と、
前記言語表現データ照会手段の照会結果に基づき、前記話者に固有の言語表現データが前記データベースに保存されていない場合は、前記言語表現データ抽出手段で抽出された前記話者に固有の言語表現データを、前記顔関連データ抽出手段で抽出された前記話者の顔関連データと前記話者を識別可能な識別データと関連付けて前記データベースに保存する言語表現データ保存手段と、を更に備え、
前記翻訳手段は、前記話者に固有の言語表現データが前記データベースに既に保存されている場合は、前記データベースに保存されている前記話者の言語表現データを用いて、前記他の言語のテキストデータへの変換を行うことを特徴とする眼鏡型表示装置。 - 請求項1乃至3のいずれかの眼鏡型表示装置において、
前記顔関連データ抽出手段で抽出された前記話者の顔画像データ及び顔特徴データの少なくとも一方に基づいて、前記話者の表情を判断する表情判断手段を、更に備え、
前記翻訳手段は、前記表情判断手段で判断した前記話者の表情の情報を用いて、前記他の言語のテキストデータへの変換を行うことを特徴とする眼鏡型表示装置。 - 請求項1乃至4のいずれかの眼鏡型表示装置において、
前記音声認識手段による音声信号のテキストデータへの変換と、前記翻訳手段による前記他の言語のテキストデータへの変換とを、複数の話者それぞれについて同時に行うことを特徴とする眼鏡型表示装置。 - 請求項2又は3の眼鏡型表示装置において、
前記翻訳手段で前記他の言語のテキストデータに変換された翻訳結果に問題が無かったか否かを検証する翻訳結果検証手段と、
前記翻訳結果検証手段で前記翻訳結果に問題がないと判断した場合は、前記話者に固有の辞書データとして、前記翻訳結果を前記話者の識別データと関連付けて前記データベースに保存する辞書データ保存手段と、を更に備えたことを特徴とする眼鏡型表示装置。 - 請求項6の眼鏡型表示装置において、
前記翻訳結果に問題があったことを前記話者に知らせるメッセージ及び問題があった翻訳結果の部分を前記話者に聞き直すメッセージの少なくとも一方を前記話者に対して出力するメッセージ出力手段を更に備え、
前記翻訳結果検証手段で前記翻訳結果に問題があると判断した場合に、前記翻訳手段による前記他の言語のテキストデータへの変換のやり直し、又は、前記メッセージ出力手段による前記メッセージの出力を行うことを特徴とする眼鏡型表示装置。 - 請求項6又は7の眼鏡型表示装置において、
前記眼鏡型表示装置を装着した利用者の眼を撮像する利用者撮像手段と、前記利用者の音声を受音して音声信号に変換する利用者音声受音手段と、前記利用者音声受音手段から出力される前記利用者の音声信号をテキストデータに変換する利用者音声認識手段と、を更に備え、
前記翻訳結果検証手段は、前記利用者撮像手段で撮像した前記利用者の眼の表情や動き、前記利用者音声受音手段で受音した前記利用者の音声信号、及び前記利用者音声認識手段から出力される前記利用者の音声のテキストデータの少なくとも一つに基づいて、前記翻訳結果を検証することを特徴とする眼鏡型表示装置。 - 請求項1乃至8のいずれかの眼鏡型表示装置において、
複数の話者について該話者に固有の顔画像データ、顔特徴データ、音声特徴データ、言語表現データ及び辞書データの少なくとも一つのデータが保存されているデータベースが設けられたサーバ装置との間で、通信ネットワークを介して通信するための通信手段を、更に備えたことを特徴とする眼鏡型表示装置。 - 請求項9の眼鏡型表示装置と、前記データベースが設けられたサーバ装置とを備えたことを特徴とする翻訳システム。
- 請求項10の翻訳システムにおいて、
前記顔関連データ抽出手段、前記音声信号抽出手段、前記音声認識手段及び前記翻訳手段の少なくとも一つを、前記眼鏡型表示装置に備える代わりに前記サーバ装置に備えるように構成したことを特徴とする翻訳システム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010203125A JP5666219B2 (ja) | 2010-09-10 | 2010-09-10 | 眼鏡型表示装置及び翻訳システム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010203125A JP5666219B2 (ja) | 2010-09-10 | 2010-09-10 | 眼鏡型表示装置及び翻訳システム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2012059121A true JP2012059121A (ja) | 2012-03-22 |
| JP5666219B2 JP5666219B2 (ja) | 2015-02-12 |
Family
ID=46056118
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010203125A Active JP5666219B2 (ja) | 2010-09-10 | 2010-09-10 | 眼鏡型表示装置及び翻訳システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5666219B2 (ja) |
Cited By (36)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014191239A (ja) * | 2013-03-27 | 2014-10-06 | Brother Ind Ltd | 音声認識装置及び音声認識プログラム |
| WO2015047593A1 (en) * | 2013-09-24 | 2015-04-02 | Nuance Communications, Inc. | Wearable communication enhancement device |
| JP2015072415A (ja) * | 2013-10-04 | 2015-04-16 | セイコーエプソン株式会社 | 表示装置、頭部装着型表示装置、表示装置の制御方法、および、頭部装着型表示装置の制御方法 |
| KR20150055751A (ko) * | 2013-11-14 | 2015-05-22 | 엘지전자 주식회사 | 헤드 마운트 디스플레이 장치 |
| JP2015102667A (ja) * | 2013-11-25 | 2015-06-04 | シャープ株式会社 | 電子機器 |
| JP2015220684A (ja) * | 2014-05-20 | 2015-12-07 | 株式会社ニコン | 携帯端末装置および読唇処理プログラム |
| JP2016033757A (ja) * | 2014-07-31 | 2016-03-10 | セイコーエプソン株式会社 | 表示装置、表示装置の制御方法、および、プログラム |
| WO2016075781A1 (ja) * | 2014-11-12 | 2016-05-19 | 富士通株式会社 | ウェアラブルデバイス、表示制御方法、及び表示制御プログラム |
| WO2016075782A1 (ja) * | 2014-11-12 | 2016-05-19 | 富士通株式会社 | ウェアラブルデバイス、表示制御方法、及び表示制御プログラム |
| WO2016075780A1 (ja) * | 2014-11-12 | 2016-05-19 | 富士通株式会社 | ウェアラブルデバイス、表示制御方法、及び表示制御プログラム |
| JP2016127463A (ja) * | 2015-01-06 | 2016-07-11 | セイコーエプソン株式会社 | 頭部装着型表示装置、頭部装着型表示装置の制御方法、情報システム、および、コンピュータープログラム |
| JP2017517045A (ja) * | 2014-03-25 | 2017-06-22 | マイクロソフト テクノロジー ライセンシング,エルエルシー | アイトラッキング対応型のスマートなクローズドキャプショニング |
| US10228895B2 (en) | 2012-11-06 | 2019-03-12 | Sony Corporation | Image display device, image display method, and computer program |
| US20190188265A1 (en) * | 2017-12-14 | 2019-06-20 | Electronics And Telecommunications Research Institute | Apparatus and method for selecting speaker by using smart glasses |
| WO2019150708A1 (ja) * | 2018-02-01 | 2019-08-08 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
| CN111597828A (zh) * | 2020-05-06 | 2020-08-28 | Oppo广东移动通信有限公司 | 翻译显示方法、装置、头戴显示设备及存储介质 |
| US10872605B2 (en) | 2016-07-08 | 2020-12-22 | Panasonic Intellectual Property Management Co., Ltd. | Translation device |
| JP2021015189A (ja) * | 2019-07-11 | 2021-02-12 | 中部電力株式会社 | マルチモーダル音声認識装置およびマルチモーダル音声認識方法 |
| JP2021015264A (ja) * | 2019-07-11 | 2021-02-12 | サウンドハウンド,インコーポレイテッド | 視覚支援スピーチ処理 |
| JP2021124700A (ja) * | 2020-02-10 | 2021-08-30 | 株式会社Qdレーザ | 画像投影装置、画像投影方法、画像投影システム、プログラム |
| WO2021230180A1 (ja) * | 2020-05-11 | 2021-11-18 | ピクシーダストテクノロジーズ株式会社 | 情報処理装置、ディスプレイデバイス、提示方法、及びプログラム |
| JP2022510752A (ja) * | 2018-10-25 | 2022-01-28 | フェイスブック・テクノロジーズ・リミテッド・ライアビリティ・カンパニー | Arにおける自然言語翻訳 |
| CN114556469A (zh) * | 2019-12-20 | 2022-05-27 | 深圳市欢太科技有限公司 | 数据处理方法、装置、电子设备和存储介质 |
| CN114641823A (zh) * | 2020-10-13 | 2022-06-17 | 谷歌有限责任公司 | 使用可穿戴设备的分布式声音识别 |
| KR20220099083A (ko) * | 2021-01-05 | 2022-07-12 | 한국전자통신연구원 | 화자분리 기반 자동통역 서비스를 제공하는 시스템, 사용자 단말 및 방법 |
| JP2022105982A (ja) * | 2021-01-05 | 2022-07-15 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート | 話者分離基盤の自動通訳方法、話者分離基盤の自動通訳サービスを提供するユーザ端末、及び、話者分離基盤の自動通訳サービス提供システム |
| JP2022187072A (ja) * | 2021-06-07 | 2022-12-19 | 矢崎総業株式会社 | ウェアラブル機器 |
| WO2022270455A1 (ja) * | 2021-06-21 | 2022-12-29 | ピクシーダストテクノロジーズ株式会社 | 表示制御装置、表示制御方法、及びプログラム |
| WO2022270456A1 (ja) * | 2021-06-21 | 2022-12-29 | ピクシーダストテクノロジーズ株式会社 | 表示制御装置、表示制御方法、及びプログラム |
| JP2023506469A (ja) * | 2019-12-09 | 2023-02-16 | チョル キム、ギョン | 使用者端末、及びその制御方法 |
| WO2023145152A1 (ja) * | 2022-01-26 | 2023-08-03 | マクセル株式会社 | ヘッドアップディスプレイ装置 |
| JP2023117068A (ja) * | 2022-02-10 | 2023-08-23 | 株式会社リコー | 音声認識装置、音声認識方法、音声認識プログラム、音声認識システム |
| WO2023157963A1 (ja) * | 2022-02-21 | 2023-08-24 | ピクシーダストテクノロジーズ株式会社 | 情報処理装置、情報処理方法、及びプログラム |
| WO2023249073A1 (ja) * | 2022-06-23 | 2023-12-28 | ピクシーダストテクノロジーズ株式会社 | 情報処理装置、ディスプレイデバイス、情報処理方法、及びプログラム |
| WO2024235182A1 (zh) * | 2023-05-18 | 2024-11-21 | 所乐思(深圳)科技有限公司 | 基于生成式人工智能大语言模型的智能眼镜、系统及控制方法 |
| JP2025048861A (ja) * | 2023-09-20 | 2025-04-03 | ソフトバンクグループ株式会社 | システム |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20230031491A (ko) | 2021-08-27 | 2023-03-07 | 삼성전자주식회사 | 발화 대상을 구분하여 음성 처리하는 방법 및 장치 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010048851A (ja) * | 2008-08-19 | 2010-03-04 | Olympus Imaging Corp | 表示装置および表示方法 |
| JP2011139227A (ja) * | 2009-12-28 | 2011-07-14 | Brother Industries Ltd | ヘッドマウントディスプレイ |
-
2010
- 2010-09-10 JP JP2010203125A patent/JP5666219B2/ja active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010048851A (ja) * | 2008-08-19 | 2010-03-04 | Olympus Imaging Corp | 表示装置および表示方法 |
| JP2011139227A (ja) * | 2009-12-28 | 2011-07-14 | Brother Industries Ltd | ヘッドマウントディスプレイ |
Cited By (56)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10228895B2 (en) | 2012-11-06 | 2019-03-12 | Sony Corporation | Image display device, image display method, and computer program |
| JP2014191239A (ja) * | 2013-03-27 | 2014-10-06 | Brother Ind Ltd | 音声認識装置及び音声認識プログラム |
| WO2015047593A1 (en) * | 2013-09-24 | 2015-04-02 | Nuance Communications, Inc. | Wearable communication enhancement device |
| US9848260B2 (en) | 2013-09-24 | 2017-12-19 | Nuance Communications, Inc. | Wearable communication enhancement device |
| JP2015072415A (ja) * | 2013-10-04 | 2015-04-16 | セイコーエプソン株式会社 | 表示装置、頭部装着型表示装置、表示装置の制御方法、および、頭部装着型表示装置の制御方法 |
| KR102137511B1 (ko) * | 2013-11-14 | 2020-07-27 | 엘지전자 주식회사 | 헤드 마운트 디스플레이 장치 |
| KR20150055751A (ko) * | 2013-11-14 | 2015-05-22 | 엘지전자 주식회사 | 헤드 마운트 디스플레이 장치 |
| JP2015102667A (ja) * | 2013-11-25 | 2015-06-04 | シャープ株式会社 | 電子機器 |
| US10447960B2 (en) | 2014-03-25 | 2019-10-15 | Microsoft Technology Licensing, Llc | Eye tracking enabled smart closed captioning |
| JP2017517045A (ja) * | 2014-03-25 | 2017-06-22 | マイクロソフト テクノロジー ライセンシング,エルエルシー | アイトラッキング対応型のスマートなクローズドキャプショニング |
| JP2015220684A (ja) * | 2014-05-20 | 2015-12-07 | 株式会社ニコン | 携帯端末装置および読唇処理プログラム |
| JP2016033757A (ja) * | 2014-07-31 | 2016-03-10 | セイコーエプソン株式会社 | 表示装置、表示装置の制御方法、および、プログラム |
| US9972319B2 (en) | 2014-07-31 | 2018-05-15 | Seiko Epson Corporation | Display device, method of controlling display device, and program having display of voice and other data |
| US20170243519A1 (en) * | 2014-11-12 | 2017-08-24 | Fujitsu Limited | Wearable device, display control method, and computer-readable recording medium |
| WO2016075780A1 (ja) * | 2014-11-12 | 2016-05-19 | 富士通株式会社 | ウェアラブルデバイス、表示制御方法、及び表示制御プログラム |
| JPWO2016075781A1 (ja) * | 2014-11-12 | 2017-10-26 | 富士通株式会社 | ウェアラブルデバイス、表示制御方法、及び表示制御プログラム |
| WO2016075781A1 (ja) * | 2014-11-12 | 2016-05-19 | 富士通株式会社 | ウェアラブルデバイス、表示制御方法、及び表示制御プログラム |
| JPWO2016075782A1 (ja) * | 2014-11-12 | 2017-10-26 | 富士通株式会社 | ウェアラブルデバイス、表示制御方法、及び表示制御プログラム |
| WO2016075782A1 (ja) * | 2014-11-12 | 2016-05-19 | 富士通株式会社 | ウェアラブルデバイス、表示制御方法、及び表示制御プログラム |
| US10490101B2 (en) | 2014-11-12 | 2019-11-26 | Fujitsu Limited | Wearable device, display control method, and computer-readable recording medium |
| JP2016127463A (ja) * | 2015-01-06 | 2016-07-11 | セイコーエプソン株式会社 | 頭部装着型表示装置、頭部装着型表示装置の制御方法、情報システム、および、コンピュータープログラム |
| US10872605B2 (en) | 2016-07-08 | 2020-12-22 | Panasonic Intellectual Property Management Co., Ltd. | Translation device |
| US20190188265A1 (en) * | 2017-12-14 | 2019-06-20 | Electronics And Telecommunications Research Institute | Apparatus and method for selecting speaker by using smart glasses |
| US10796106B2 (en) | 2017-12-14 | 2020-10-06 | Electronics And Telecommunications Research Institute | Apparatus and method for selecting speaker by using smart glasses |
| WO2019150708A1 (ja) * | 2018-02-01 | 2019-08-08 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
| JP7284252B2 (ja) | 2018-10-25 | 2023-05-30 | メタ プラットフォームズ テクノロジーズ, リミテッド ライアビリティ カンパニー | Arにおける自然言語翻訳 |
| JP2022510752A (ja) * | 2018-10-25 | 2022-01-28 | フェイスブック・テクノロジーズ・リミテッド・ライアビリティ・カンパニー | Arにおける自然言語翻訳 |
| JP7242520B2 (ja) | 2019-07-11 | 2023-03-20 | サウンドハウンド,インコーポレイテッド | 視覚支援スピーチ処理 |
| JP2021015264A (ja) * | 2019-07-11 | 2021-02-12 | サウンドハウンド,インコーポレイテッド | 視覚支援スピーチ処理 |
| JP7414231B2 (ja) | 2019-07-11 | 2024-01-16 | 中部電力株式会社 | マルチモーダル音声認識装置およびマルチモーダル音声認識方法 |
| JP2021015189A (ja) * | 2019-07-11 | 2021-02-12 | 中部電力株式会社 | マルチモーダル音声認識装置およびマルチモーダル音声認識方法 |
| JP2023506469A (ja) * | 2019-12-09 | 2023-02-16 | チョル キム、ギョン | 使用者端末、及びその制御方法 |
| JP7519441B2 (ja) | 2019-12-09 | 2024-07-19 | チョル キム、ギョン | 使用者端末、及びその制御方法 |
| CN114556469A (zh) * | 2019-12-20 | 2022-05-27 | 深圳市欢太科技有限公司 | 数据处理方法、装置、电子设备和存储介质 |
| JP2021124700A (ja) * | 2020-02-10 | 2021-08-30 | 株式会社Qdレーザ | 画像投影装置、画像投影方法、画像投影システム、プログラム |
| CN111597828B (zh) * | 2020-05-06 | 2023-10-03 | Oppo广东移动通信有限公司 | 翻译显示方法、装置、头戴显示设备及存储介质 |
| CN111597828A (zh) * | 2020-05-06 | 2020-08-28 | Oppo广东移动通信有限公司 | 翻译显示方法、装置、头戴显示设备及存储介质 |
| WO2021230180A1 (ja) * | 2020-05-11 | 2021-11-18 | ピクシーダストテクノロジーズ株式会社 | 情報処理装置、ディスプレイデバイス、提示方法、及びプログラム |
| JPWO2021230180A1 (ja) * | 2020-05-11 | 2021-11-18 | ||
| CN114641823A (zh) * | 2020-10-13 | 2022-06-17 | 谷歌有限责任公司 | 使用可穿戴设备的分布式声音识别 |
| JP2022105982A (ja) * | 2021-01-05 | 2022-07-15 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート | 話者分離基盤の自動通訳方法、話者分離基盤の自動通訳サービスを提供するユーザ端末、及び、話者分離基盤の自動通訳サービス提供システム |
| US12112769B2 (en) | 2021-01-05 | 2024-10-08 | Electronics And Telecommunications Research Institute | System, user terminal, and method for providing automatic interpretation service based on speaker separation |
| KR20220099083A (ko) * | 2021-01-05 | 2022-07-12 | 한국전자통신연구원 | 화자분리 기반 자동통역 서비스를 제공하는 시스템, 사용자 단말 및 방법 |
| KR102584436B1 (ko) * | 2021-01-05 | 2023-10-05 | 한국전자통신연구원 | 화자분리 기반 자동통역 서비스를 제공하는 시스템, 사용자 단말 및 방법 |
| JP2022187072A (ja) * | 2021-06-07 | 2022-12-19 | 矢崎総業株式会社 | ウェアラブル機器 |
| JPWO2022270456A1 (ja) * | 2021-06-21 | 2022-12-29 | ||
| WO2022270456A1 (ja) * | 2021-06-21 | 2022-12-29 | ピクシーダストテクノロジーズ株式会社 | 表示制御装置、表示制御方法、及びプログラム |
| JPWO2022270455A1 (ja) * | 2021-06-21 | 2022-12-29 | ||
| WO2022270455A1 (ja) * | 2021-06-21 | 2022-12-29 | ピクシーダストテクノロジーズ株式会社 | 表示制御装置、表示制御方法、及びプログラム |
| WO2023145152A1 (ja) * | 2022-01-26 | 2023-08-03 | マクセル株式会社 | ヘッドアップディスプレイ装置 |
| JP2023117068A (ja) * | 2022-02-10 | 2023-08-23 | 株式会社リコー | 音声認識装置、音声認識方法、音声認識プログラム、音声認識システム |
| JP7399413B1 (ja) * | 2022-02-21 | 2023-12-18 | ピクシーダストテクノロジーズ株式会社 | 情報処理装置、情報処理方法、及びプログラム |
| WO2023157963A1 (ja) * | 2022-02-21 | 2023-08-24 | ピクシーダストテクノロジーズ株式会社 | 情報処理装置、情報処理方法、及びプログラム |
| WO2023249073A1 (ja) * | 2022-06-23 | 2023-12-28 | ピクシーダストテクノロジーズ株式会社 | 情報処理装置、ディスプレイデバイス、情報処理方法、及びプログラム |
| WO2024235182A1 (zh) * | 2023-05-18 | 2024-11-21 | 所乐思(深圳)科技有限公司 | 基于生成式人工智能大语言模型的智能眼镜、系统及控制方法 |
| JP2025048861A (ja) * | 2023-09-20 | 2025-04-03 | ソフトバンクグループ株式会社 | システム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP5666219B2 (ja) | 2015-02-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5666219B2 (ja) | 眼鏡型表示装置及び翻訳システム | |
| US12032155B2 (en) | Method and head-mounted unit for assisting a hearing-impaired user | |
| US9519640B2 (en) | Intelligent translations in personal see through display | |
| KR102576135B1 (ko) | 감각 안경류 | |
| US20200335128A1 (en) | Identifying input for speech recognition engine | |
| US20130307855A1 (en) | Holographic story telling | |
| EP3220372B1 (en) | Wearable device, display control method, and display control program | |
| JP6551417B2 (ja) | ウェアラブルデバイス、表示制御方法、及び表示制御プログラム | |
| WO2013173531A1 (en) | Synchronizing virtual actor's performances to a speaker's voice | |
| US20200183496A1 (en) | Information processing apparatus and information processing method | |
| KR20240042461A (ko) | 무음 음성 검지 | |
| KR20190093166A (ko) | 커뮤니케이션 로봇 및 그 제어 프로그램 | |
| US12537013B2 (en) | Audio-visual speech recognition control for wearable devices | |
| WO2023146879A1 (en) | User authentication using combination of vocalization and skin vibration | |
| US20240419721A1 (en) | Gaze assisted search query | |
| JP2023117068A (ja) | 音声認識装置、音声認識方法、音声認識プログラム、音声認識システム | |
| CN118672389A (zh) | 响应于确定用户注意力的转移来修改用户环境中的声音 | |
| JP2007272534A (ja) | 省略語補完装置、省略語補完方法、及びプログラム | |
| US20240119684A1 (en) | Display control apparatus, display control method, and program | |
| US12464307B2 (en) | Translation with audio spatialization | |
| US11871198B1 (en) | Social network based voice enhancement system | |
| WO2021230180A1 (ja) | 情報処理装置、ディスプレイデバイス、提示方法、及びプログラム | |
| CN108509430A (zh) | 智能眼镜及其翻译方法 | |
| CN112751582A (zh) | 用于交互的可穿戴装置、交互方法及设备、存储介质 | |
| JPH0728488A (ja) | 情報処理方法及び装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130725 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140116 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140131 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140324 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140912 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140925 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141128 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141210 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5666219 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |