[go: up one dir, main page]

JP2014072835A - 会議装置 - Google Patents

会議装置 Download PDF

Info

Publication number
JP2014072835A
JP2014072835A JP2012219437A JP2012219437A JP2014072835A JP 2014072835 A JP2014072835 A JP 2014072835A JP 2012219437 A JP2012219437 A JP 2012219437A JP 2012219437 A JP2012219437 A JP 2012219437A JP 2014072835 A JP2014072835 A JP 2014072835A
Authority
JP
Japan
Prior art keywords
camera
voice
microphones
microphone
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012219437A
Other languages
English (en)
Inventor
Osamu Sato
佐藤  修
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2012219437A priority Critical patent/JP2014072835A/ja
Publication of JP2014072835A publication Critical patent/JP2014072835A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephonic Communication Services (AREA)
  • Studio Devices (AREA)

Abstract

【課題】カメラを装置本体に対して折りたたみ可能な会議装置であっても明瞭に話者の音声を収音することができる会議装置を提供すること。
【解決手段】通信網を介して音声および画像の双方向通信を行う会議装置は、装置本体と、装置本体に対して折りたたみ可能に設けられたカメラ筺体4と、カメラ40の近傍に位置し、かつ収音する音声に時間差が生じる間隔でカメラ筺体4に配置された複数のマイク42a、42b、42cと、マイク42a、42b、42cのそれぞれによって収音された各音声の音声レベルを検出するとともに各音声間の時間差を検出する検出部と、収音された各音声のうち、最大の音声レベルを有し、かつ最先に収音されたマイクの音声を選択する音声選択部と、音声選択部により選択された音声およびカメラ40により取り込まれた画像を通信網に送信する通信部とを備える。
【選択図】図2

Description

本発明は、会議装置に関し、特に通信網を介して相手方装置との双方向通信を行う会議装置に関する。
従来、この種の会議装置として、相手の映像を映し出すモニタと、音声データを出力するスピーカと、音声を電気信号として捉える、すなわち音声を収音するマイクロフォン(以下、単にマイクという)と、自装置の前にいる会議の参加者を撮像するカメラとを一体化したものが知られている(例えば、特許文献1参照)。
この特許文献1に記載の会議装置は、モニタに映し出される相手を見ながら会話することを前提として、モニタ付近にスピーカ、マイクおよびカメラを近接して配置している。
また、この会議装置は、マイクを複数有しており、これら複数のマイクから収音される各音声のレベルから話者の方向を特定する。そして、その話者の方向に対応するマイクからの音声を会議に必要な音声としてエコーキャンセル処理を施し、通信網を介して送信するようになっている。
さらに、近年、こうしたポータブルタイプの会議装置において、持ち運びの利便性を考慮して、モニタを設けず、かつカメラを装置本体に対して折りたたみ可能にしたコンパクトな会議装置も知られている(例えば、特許文献2参照)。この会議装置は、装置本体側にスピーカやマイクを配置している。
しかしながら、上述した特許文献1に記載の会議装置にあっては、モニタ、スピーカ、マイクおよびカメラが一の筺体に収容された構造をなしているので、モニタ付近にスピーカ、マイクおよびカメラを近接して配置することは容易であるが、こうした配置を特許文献2に記載の会議装置に適用することまでは考慮されていない。
一方、特許文献2に記載の会議装置は、装置本体側にマイクが配置されているため、例えば机上に設置されているような場合、話者の口元の高さからマイクが遠くなり話者の音声を明瞭に収音することができないという課題があった。
本発明は、上述のような事情に鑑みてなされたもので、カメラを装置本体に対して折りたたみ可能な会議装置であっても明瞭に話者の音声を収音することができる会議装置を提供することを目的とする。
本発明に係る会議装置は、上記目的を達成するため、通信網を介して音声および画像の双方向通信を行う会議装置であって、装置本体と、前記装置本体に対して折りたたみ可能に設けられ、画像の取り込みを行うカメラを収納したカメラ筺体と、前記カメラの近傍に位置し、かつ収音する音声に時間差が生じる間隔で前記カメラ筺体に配置された複数のマイクと、前記複数のマイクのそれぞれによって収音された各音声の音声レベルを検出するレベル検出部と、前記複数のマイクのそれぞれによって収音された各音声間の時間差を検出する時間差検出部と、前記複数のマイクのそれぞれによって収音された各音声のうち、最大の音声レベルを有し、かつ最先に収音されたマイクの音声を選択する音声選択部と、前記音声選択部により選択された音声および前記カメラにより取り込まれた画像を前記通信網に送信する通信部と、を備えた構成を有する。
本発明によれば、カメラを装置本体に対して折りたたみ可能な会議装置であっても明瞭に話者の音声を収音することができる会議装置を提供することができる。
本発明の実施の形態に係る会議装置の外観斜視図である。 本発明の実施の形態に係る会議装置のカメラを示す正面図である。 本発明の実施の形態に係るカメラを下方から見た一部断面図である。 本発明の実施の形態に係る会議装置の構成を示すブロック図である。
以下、本発明の実施の形態について、図面を参照して説明する。
まず、本実施の形態に係る会議装置1の構成について説明する。図1は、本実施の形態に係る会議装置1の外観図である。なお、図1において、会議装置1の長手方向をX軸方向、水平面内でX軸方向に直交する方向をY軸方向、X軸方向およびY軸方向に直交する方向(鉛直方向)をZ軸方向として説明する。
図1に示すように、本実施の形態に係る会議装置1は、装置本体2と、アーム3と、カメラハウジング4とを含んで構成されている。会議装置1は、通信網を介して音声および画像の双方向通信を行うものである。
装置本体2の前側壁面2aには、複数の吸気孔によって形成された図示しない吸気面が設けられている。また、装置本体2の後側壁面2bには、複数の排気孔が形成された排気面21が設けられている。
これにより、装置本体2に内蔵された図示しない冷却ファンの駆動によって、吸気面を介して会議装置1の後方の外気を取り込み、排気面21を介して会議装置1の後方へ排気することができる。
また、装置本体2の右側壁面2cには、外部機器接続I/Fに対して電気的にケーブルを接続するための複数の接続口22a〜22cが設けられている。一方、装置本体2の左側壁面2dには、外部機器接続I/Fに対して電気的にディスプレイ120用のケーブル120cを接続するための図示しない接続口が設けられている。
装置本体2の上面には、操作パネル23が形成されている。この操作パネル23には、複数の操作ボタン23a〜23e、電源スイッチ24、アラームランプ25および音出面26が設けられている。音出面26は、図示しない内蔵型のスピーカからの出力音を通すための複数の音声出力孔によって形成されている。
また、装置本体2の上面であって左側壁面2d側には、アーム3およびカメラハウジング4を折りたたみ可能に収容するための凹部としての収容部27が形成されている。アーム3およびカメラハウジング4は、会議装置1を使用しないとき(例えば運搬時等)には収容部27に折りたたんだ状態で収容される。これにより、会議装置1のコンパクト化が図られている。
アーム3は、トルクヒンジ31を介して装置本体2に取り付けられている。したがって、アーム3は、装置本体2に対して135度のチルト角θ1の範囲で、上下方向に回転可能に構成されている。図1では、チルト角θ1が90度の状態を示している。
カメラハウジング4には、画像の取り込みを行うCCDやCMOS等の撮像素子を備えたカメラ40が収納されている。この収納されたカメラ40によって、利用者、書類および部屋等を撮像することができる。本実施の形態におけるカメラハウジング4は、本発明に係るカメラ筺体を構成している。
カメラハウジング4は、トルクヒンジ41を介してアーム3に取り付けられている。したがって、カメラハウジング4は、アーム3に対して、図1で示されている状態を0度として±180度のパン角θ2の範囲で、かつ±45度のチルト角θ3の範囲で、上下左右方向に回転可能に構成されている。
また、カメラハウジング4には、図2に示すように、複数(本実施の形態では3つ)のマイク42a、42b、42cが設けられている。これらマイク42a、42b、42cは、カメラ40の近傍に位置し、かつ収音する音声に時間差が生じる間隔でカメラハウジング4に配置されている。なお、マイクの数は、3つに限定されるものではなく、配置可能な範囲で2つあるいは4つ以上としてもよい。
また、図3に示すように、マイク42a、42b、42cは、カメラ40の撮像範囲と一致する範囲の音声を収音可能な角度に配置されている。つまり、本実施の形態では、マイク42aを0度としてマイク42b、42cを±所定角度となるよう配置している。このようなマイク42a、42b、42cの配置は、カメラ40の画角に合わせたもので、例えばカメラ40の撮像範囲外、すなわち画面外の音声を拾わないようにしたものである。したがって、マイク42b、42cの配置角度は、カメラ40の画角とマイク42a、42b、42cの指向性により設定される。
次に、図4を参照して、本実施の形態に係る会議装置1の処理について説明する。
図4に示すように、マイク42a、42b、42cのそれぞれで収音された音声は、音声信号に変換されて各増幅器(AMP)43a、43b、43cに入力される。マイク42a、42b、42cから入力された音声信号は、各増幅器(AMP)43a、43b、43cによって増幅された後、レベル検出および遅延検出を行う検出部44に入力される。
検出部44は、各増幅器(AMP)43a、43b、43cから入力された音声信号の音声レベルを検出し、検出した音声レベルの値等の情報を音声選択部45に出力する。すなわち、検出部44は、マイク42a、42b、42cのそれぞれによって収音された各音声の音声レベルを検出するレベル検出を行うレベル検出部としての機能を有する。こうしたレベル検出部としての機能を有する検出部44は、本発明に係るレベル検出部を構成する。例えば、検出部44は、音声信号を信号中の交流レベルに対応した直流レベルに検波し、その波形の平滑化やA/D変換等の処理を施して有効なデジタル情報に変換する。
また、検出部44は、各音声信号の音声レベルを比較し、音声レベルの高い順(あるいは低い順)に羅列する。
さらに、検出部44は、各増幅器(AMP)43a、43b、43cから入力される音声信号の時間的なずれ、つまり時間差を検出して、検出した各音声信号間の時間差情報を音声選択部45に出力する。すなわち、検出部44は、マイク42a、42b、42cのそれぞれによって収音された各音声間の時間差を検出する遅延検出を行う遅延検出部としての機能を有する。本実施の形態では、上述のレベル検出後に音声レベルの高い順(あるいは低い順)に羅列された各音声信号間のタイミングのずれ、すなわち各音声信号の位相差を検出する。ここで、収音された音声が同一であれば、音声レベルの高い順に音声信号のタイミングが遅延していく。こうした遅延検出部としての機能を有する検出部44は、本発明に係る時間差検出部を構成する。
ここで、遅延検出の原理について説明する。
一般的に、気温25℃のときの音速は、約350[m/s]である。このとき、例えば音声の到来方向に対して2つのマイクが3.5[cm]間隔で配置されていた場合には、音声の発生源に近いマイクに対して3.5[cm]後方のマイクに到達する音声には、音声の発生源に近いマイクに到達する音声よりも約100[μs]の遅延が生じる。本実施の形態では、こうした原理を利用して遅延検出を行うようにしている。
具体的には、各マイク42a、42b、42cは、上述したように収音する音声に時間差が生じる間隔で配置されているので、例えば話者がカメラ40の正面にいる場合にはマイク42aで最も早く音声が収音され、遅れてマイク42b、42cによって音声が収音される。
また、話者がカメラ40に対して斜め正面にいる場合、例えば話者がマイク42cの正面にいるような場合には、マイク42cで最も早く音声が収音され、遅れてマイク42a、マイク42bの順に音声が収音される。
したがって、本実施の形態では、こうしたマイク42a、42b、42cのそれぞれで収音される音声間の時間差を検出することで、話者がカメラ40に対していずれの方向にいるのかを特定することができる。
次に、音声選択部45は、検出部44から入力された各音声信号のうち、最も音声レベルが高く、かつ遅延検出に基づき最も早く収音された音声の音声信号を選択する。すなわち、音声選択部45は、マイク42a、42b、42cのそれぞれによって収音された各音声のうち、最大の音声レベルを有し、かつ最先に収音されたマイクの音声を選択する。
音声選択部45によって、音声の発生源である話者の位置が特定される。つまり、音声選択部45によって選択された音声信号を出力しているマイクの方向に話者がいると判断することができる。
音声選択部45によって選択された音声信号は、増幅処理が施された後、ネットワークI/F等の通信部46を介して通信網に送信される。同時に、音声選択部45によって選択された音声信号の情報が後述するマイク感度調整および顔検出に用いられるようになっている。このとき、音声選択部45によって選択された音声信号以外の同一音声の音声信号は、フィルタ47によってカットされ、その後の処理に用いられない。
そして、フィルタ47を通過後の音声信号は、増幅器(AMP)43a、43b、43cを有するマイク感度調整部43に送信される。マイク感度調整部43は、フィルタ47を介して入力された音声信号に基づき、この音声信号を収音したマイクの感度を上げるために同マイクに対応する増幅器の増幅率を調整する。これにより、音声選択部45によって選択された音声信号を出力しているマイクの感度が上げられ、同マイクでより明瞭な音声を収音可能となる。
また、音声選択部45によって選択された音声信号は、その選択回数が頻度カウント部48によりカウントされる。頻度カウント部48は、所定の単位時間間隔で音声選択部45によって選択された音声信号が入力されるようになっており、マイク42a、42b、42cごとに音声選択部45によって選択された回数を記憶するようになっている。これにより、いずれのマイクの選択頻度が高いかを判断することができ、これによって多く発言する話者がどこにいるのかを特定することが可能となる。本実施の形態における頻度カウント部48は、本発明に係る選択回数カウント部を構成する。
また、マイク感度調整部43は、頻度カウント部48により選択された回数に応じてマイク42a、42b、42cの感度を調整するようにしてもよい。例えば、マイク感度調整部43は、頻度カウント部48により選択された回数が最も多いマイクの感度を他のマイクの感度よりも高くなるよう調整する。これにより、発言頻度の高い話者の音声をより明瞭に収音することができる。
一方、カメラ40は、公知の顔認識機能を有する顔検出部50と、少なくともズーム機能を有するカメラ制御部51とを備えている。
顔検出部50は、公知の顔認識機能として、例えば肌の色や、目、鼻、口を検出することにより人の顔を検出する一般的な顔検出手法を用いることができる。また、顔検出部50は、音声選択部45によって選択された音声信号の情報をフィルタ47を介して音声選択部45から取得することにより、選択された音声の発生源である話者に対してマーキング等を施すことができる。なお、顔検出部50は、頻度カウント部48により選択された回数が最も多いマイクの収音範囲と顔認識機能とに基づいて発言頻度の高い話者を特定し、その話者に対してマーキング等を施すことも可能である。
カメラ制御部51は、顔検出部50によってマーキング等が施された話者に対してズーミング動作を行うことができる。例えば、カメラ制御部51は、カメラ40により取り込まれた画像をマイク42a、42b、42cの方向に応じた領域に3分割し、選択された音声信号を収音したマイクに対応する領域をズームアップする等の方法により特定の話者に対してズーミングを行うことができる。これらマーキングやズーミングにより、話者との距離感を縮めることができ自然なTV会議を実現することができる。
カメラ40によって取り込まれた画像は、各種補正等の必要なカメラ処理が施された後、通信部46を介して通信網に送信される。
以上のように、本実施の形態に係る会議装置1は、装置本体2に対して折りたたみ可能なカメラハウジング4に収納されたカメラ40の近傍にマイク42a、42b、42cを設けたので、従来と比較して音声を収音するマイクの位置を話者の口元の高さに近づけることができる。これにより、話者の音声以外の不要なノイズ(例えば、机をたたく音等)を拾うことがなく、必要な音声のみを収音することができる。したがって、本実施の形態に係る会議装置1は、カメラ40を収納したカメラハウジング4を装置本体2に対して折りたたみ可能な会議装置1であっても明瞭に話者の音声を収音することができる。
また、本実施の形態に係る会議装置1は、マイク42a、42b、42cのそれぞれで収音された音声の音声レベルを検出するレベル検出を行うとともに、マイク42a、42b、42cのそれぞれによって収音された音声間の時間差を検出する遅延検出を行う検出部44を備えているので、これらレベル検出および遅延検出によって話者の方向を特定することができる。話者の方向が特定できれば、これに応じて話者の方向の音声を収音するマイクの感度を上げる等して、より明瞭な話者の音声を収音することができる。
1 会議装置
2 装置本体
3 アーム
4 カメラハウジング(カメラ筺体)
27 収容部
40 カメラ
42a、42b、42c マイク
43 マイク感度調整部
43a、43b、43c 増幅器(AMP)
44 検出部(レベル検出部、時間差検出部)
45 音声選択部
46 通信部
47 フィルタ
48 頻度カウント部(選択回数カウント部)
50 顔検出部
51 カメラ制御部
特開2008−288785号公報 特開2012−54814号公報

Claims (5)

  1. 通信網を介して音声および画像の双方向通信を行う会議装置であって、
    装置本体と、
    前記装置本体に対して折りたたみ可能に設けられ、画像の取り込みを行うカメラを収納したカメラ筺体と、
    前記カメラの近傍に位置し、かつ収音する音声に時間差が生じる間隔で前記カメラ筺体に配置された複数のマイクと、
    前記複数のマイクのそれぞれによって収音された各音声の音声レベルを検出するレベル検出部と、
    前記複数のマイクのそれぞれによって収音された各音声間の時間差を検出する時間差検出部と、
    前記複数のマイクのそれぞれによって収音された各音声のうち、最大の音声レベルを有し、かつ最先に収音されたマイクの音声を選択する音声選択部と、
    前記音声選択部により選択された音声および前記カメラにより取り込まれた画像を前記通信網に送信する通信部と、を備えたことを特徴とする会議装置。
  2. 前記複数のマイクは、前記カメラの撮像範囲と一致する範囲の音声を収音可能な角度に配置されることを特徴とする請求項1に記載の会議装置。
  3. 前記選択された音声を収音したマイクの感度を調整可能なマイク感度調整部を備えたことを特徴とする請求項1または2に記載の会議装置。
  4. 前記選択された音声を収音したマイクの選択回数をカウントする選択回数カウント部を備え、
    前記マイク感度調整部は、前記選択回数カウント部により選択された回数に応じて前記複数のマイクの感度を調整することを特徴とする請求項3に記載の会議装置。
  5. 前記カメラは、顔認識機能とズーム機能とを有し、前記選択回数カウント部により選択された回数が最も多いマイクの収音範囲と前記顔認識機能とに基づいて発言頻度の高い話者を特定するとともに、前記話者に対してマーキングおよび前記ズーム機能を用いたズーミング動作を行うことを特徴とする請求項4に記載の会議装置。
JP2012219437A 2012-10-01 2012-10-01 会議装置 Pending JP2014072835A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012219437A JP2014072835A (ja) 2012-10-01 2012-10-01 会議装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012219437A JP2014072835A (ja) 2012-10-01 2012-10-01 会議装置

Publications (1)

Publication Number Publication Date
JP2014072835A true JP2014072835A (ja) 2014-04-21

Family

ID=50747626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012219437A Pending JP2014072835A (ja) 2012-10-01 2012-10-01 会議装置

Country Status (1)

Country Link
JP (1) JP2014072835A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104735324A (zh) * 2015-03-31 2015-06-24 尚平 一种摄像头
CN104767920A (zh) * 2015-03-31 2015-07-08 尚平 一种折叠式摄像头
JP2016144112A (ja) * 2015-02-04 2016-08-08 ヤマハ株式会社 マイク選択装置、マイクシステムおよびマイク選択方法
US9953647B2 (en) 2015-01-19 2018-04-24 Samsung Electronics Co., Ltd. Method and apparatus for speech recognition
CN119520689A (zh) * 2025-01-09 2025-02-25 荣耀终端股份有限公司 设备管理方法及电子设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9953647B2 (en) 2015-01-19 2018-04-24 Samsung Electronics Co., Ltd. Method and apparatus for speech recognition
JP2016144112A (ja) * 2015-02-04 2016-08-08 ヤマハ株式会社 マイク選択装置、マイクシステムおよびマイク選択方法
CN104735324A (zh) * 2015-03-31 2015-06-24 尚平 一种摄像头
CN104767920A (zh) * 2015-03-31 2015-07-08 尚平 一种折叠式摄像头
CN119520689A (zh) * 2025-01-09 2025-02-25 荣耀终端股份有限公司 设备管理方法及电子设备

Similar Documents

Publication Publication Date Title
JP5857674B2 (ja) 画像処理装置、及び画像処理システム
JP6289121B2 (ja) 音響信号処理装置、動画撮影装置およびそれらの制御方法
US7852369B2 (en) Integrated design for omni-directional camera and microphone array
US5940118A (en) System and method for steering directional microphones
US10856071B2 (en) System and method for improving hearing
US20190028817A1 (en) System and method for a directional speaker selection
KR20190040155A (ko) 향상된 오디오를 갖는 디바이스
KR20120071452A (ko) 마이크 어레이를 이용한 방향성 음원 필터링 장치 및 그 제어방법
US20170034474A1 (en) Video conference terminal
JP2009086055A (ja) 音源方向検出装置、音源方向検出方法及び音源方向検出カメラ
JP2014072835A (ja) 会議装置
US12108224B2 (en) Method and apparatus for dynamic reduction of camera body acoustic shadowing in wind noise processing
US11563894B2 (en) Method and apparatus for active reduction of mechanically coupled vibration in microphone signals
WO2014109422A1 (ko) 음성 추적 장치 및 그 제어 방법
CN111034221A (zh) 拾音装置、拾音系统、拾音方法、程序以及校准方法
CN114466283A (zh) 音频采集方法、装置、电子设备及外设组件方法
JP2013016929A (ja) 撮像装置、撮像方法およびプログラム
WO2011108377A1 (ja) 連携動作機器、連携動作方法、連携動作制御プログラム及び機器連携システム
JP2007274462A (ja) テレビ会議装置、テレビ会議システム
JP6835205B2 (ja) 撮影収音装置、収音制御システム、撮影収音装置の制御方法、及び収音制御システムの制御方法
JP2013168878A (ja) 録音機器
JP7111202B2 (ja) 収音制御システム及び収音制御システムの制御方法
JP6569853B2 (ja) 指向性制御システム及び音声出力制御方法
WO2018064883A1 (zh) 一种录音方法、装置、设备及计算机存储介质
US20240089653A1 (en) Multi-microphone noise floor mitigation