JP2018019263A - 音声モニタリングシステム及び音声モニタリング方法 - Google Patents
音声モニタリングシステム及び音声モニタリング方法 Download PDFInfo
- Publication number
- JP2018019263A JP2018019263A JP2016148470A JP2016148470A JP2018019263A JP 2018019263 A JP2018019263 A JP 2018019263A JP 2016148470 A JP2016148470 A JP 2016148470A JP 2016148470 A JP2016148470 A JP 2016148470A JP 2018019263 A JP2018019263 A JP 2018019263A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- monitoring system
- time
- unit
- sound parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/14—Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
- H04N7/183—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/40—Visual indication of stereophonic sound image
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/57—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for processing of video signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R27/00—Public address systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Otolaryngology (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Closed-Circuit Television Systems (AREA)
- Studio Devices (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
Description
図1は、第1の実施形態の音声モニタリングシステム5の店舗への設置例を示す図である。音声モニタリングシステム5は、例えば飲食店やコンビニエンスストア等の店舗200に設置され、店長等の監視者によりモニタリングされる対象(例えば店員)の接客状況をモニタリングする。なお、以下の説明では、音声モニタリングシステム5は、店舗内に設置されるとして説明するが、設置先は店舗に限定されず、例えば工場、図書館等の公共施設、オフィス内に設置されてよい。店舗200には、多くの商品が陳列された商品棚201、カウンタ202等が設置されている。カウンタ202は、接客の一例として、来店客が購入した商品の精算等を行うために使用され、例えばレジカウンターである。商品の清算等を行う際、店員p1と来店客p2は、通常、カウンタ202を挟んで対面し、会話する。
第2の実施形態の音声モニタリングシステム5のシステム構成は第1の実施形態の音声モニタリングシステムのシステム構成と同一であるため、重複する説明は簡略化又は省略し、異なる内容について説明する。
第3の実施形態の音声モニタリングシステム5のシステム構成は第1の実施形態の音声モニタリングシステムのシステム構成と同一であるため、重複する説明は簡略化又は省略し、異なる内容について説明する。
第4の実施形態の音声モニタリングシステム5のシステム構成は第1の実施形態の音声モニタリングシステムのシステム構成と同一であるため、重複する説明は簡略化又は省略し、異なる内容について説明する。
第5の実施形態の音声モニタリングシステム5のシステム構成は第1の実施形態の音声モニタリングシステムのシステム構成と同一であるため、重複する説明は簡略化又は省略し、異なる内容について説明する。
第6の実施形態の音声モニタリングシステム5のシステム構成は第1の実施形態の音声モニタリングシステムのシステム構成と同一であるため、重複する説明は簡略化又は省略し、異なる内容について説明する。
第7の実施形態の音声モニタリングシステム5のシステム構成は第1の実施形態の音声モニタリングシステムのシステム構成と同一であるため、重複する説明は簡略化又は省略し、異なる内容について説明する。
第8の実施形態の音声モニタリングシステム5のシステム構成は第1の実施形態の音声モニタリングシステムのシステム構成と同一であるため、重複する説明は簡略化又は省略し、異なる内容について説明する。
第9の実施形態の音声モニタリングシステム5のシステム構成は第1の実施形態の音声モニタリングシステムのシステム構成と同一であるため、重複する説明は簡略化又は省略し、異なる内容について説明する。
第10の実施形態の音声モニタリングシステム5のシステム構成は第1の実施形態の音声モニタリングシステムのシステム構成と同一であるため、重複する説明は簡略化又は省略し、異なる内容について説明する。
第11の実施形態の音声モニタリングシステム5のシステム構成は第1の実施形態の音声モニタリングシステムのシステム構成と同一であるため、重複する説明は簡略化又は省略し、異なる内容について説明する。
第12の実施形態の音声モニタリングシステム5のシステム構成は第1の実施形態の音声モニタリングシステムのシステム構成と同一であるため、重複する説明は簡略化又は省略し、異なる内容について説明する。
第13の実施形態の音声モニタリングシステム5のシステム構成は第1の実施形態の音声モニタリングシステムのシステム構成と同一であるため、重複する説明は簡略化又は省略し、異なる内容について説明する。
ユーザ操作により指定された時間範囲が長時間である場合や実際の音声を再生する場合には、閲覧装置30は、その時間範囲の音データを再生しても早期に音声部分を再生できるとは限らず、音声部分が再生されるまでユーザが待たなくてはならないこともある。
10 マイクアレイ・カメラ装置
25 圧縮処理部
26 送信部
30、30A 閲覧装置
40、40A 再生制御装置
41 再生制御部
42 指向音データ生成部
43 メモリ
44、44A 信号処理部
45、45A 指定部
46 判断部
50 スピーカ
55 モニタ
58 操作部
61 CPU
62 通信部
64 電源管理部
65 イメージセンサ
66x メモリカード
66y RAM
66z ROM
67 ネットワークコネクタ
70 記録装置
71 音パラメータ算出部
72 音パラメータ保存部
441 音パラメータ算出部
442 音パラメータ表示制御部
443 色情報変換部
444 発話分析部
451 領域指定部
452 表示対象日時指定部
453 吹き出し指定部
CA 全方位カメラ
MA マイクアレイ
Claims (19)
- モニタリング対象のエリアを撮像するカメラと、
前記エリアの音を収音するマイクアレイと、
前記カメラにより撮像された撮像画像及び撮像時刻と前記マイクアレイにより収音された音とを対応付けて記録するレコーダと、
前記カメラの撮像中に前記マイクアレイにより収音された音を基に、撮像時刻における前記エリアの音の大きさを示す音パラメータを、前記撮像画像を構成する画素の所定単位毎に繰り返して算出する音パラメータ算出部と、
前記音パラメータ算出部により算出された前記音パラメータを、前記撮像時刻における撮像画像上の位置情報と対応付けて保存する音パラメータ保存部と、
前記音パラメータに基づく音源視覚画像を、前記撮像画像を構成する画素の所定単位毎に重畳してモニタに表示する音パラメータ表示制御部と、を備え、
前記音パラメータ表示制御部は、時間範囲の指定に応じて、前記音パラメータ保存部に保存された前記音パラメータの前記時間範囲における累計値に基づく前記音源視覚画像を、前記撮像画像を構成する画素の所定単位毎に重畳して前記モニタに表示する、
音声モニタリングシステム。 - 請求項1に記載の音声モニタリングシステムであって、
前記音パラメータ算出部は、前記マイクアレイにより収音された音に含まれる音声区間の有無を示す情報を用いて、前記音パラメータを算出する、
音声モニタリングシステム。 - 請求項1に記載の音声モニタリングシステムであって、
前記音パラメータ表示制御部は、前記時間範囲と前記時間範囲における前記累計値との相対値に基づいて、前記音源視覚画像に色を付与して表示する、
音声モニタリングシステム。 - 請求項1に記載の音声モニタリングシステムであって、
前記音パラメータ表示制御部は、前記累計値の絶対値に基づいて、前記音源視覚画像に色を付与して表示する、
音声モニタリングシステム。 - 請求項3又は4に記載の音声モニタリングシステムであって、
前記音パラメータ表示制御部は、前記音源視覚画像を色表示するための条件設定画面を前記モニタに表示する、
音声モニタリングシステム。 - 請求項1に記載の音声モニタリングシステムであって、
前記音パラメータ算出部は、前記音パラメータを第1間隔毎に繰り返し算出するとともに、前記第1間隔のN(Nは2以上の整数)倍以上となる第2間隔毎に、前記音パラメータを繰り返し算出し、前記第1間隔毎の前記音パラメータの算出結果と前記第2間隔毎の前記音パラメータの算出結果とを前記音パラメータ保存部に保存する、
音声モニタリングシステム。 - 請求項6に記載の音声モニタリングシステムであって、
前記音パラメータ算出部は、前記第1間隔のP(P>Nの整数)倍以上となる第3間隔毎に、前記音パラメータを繰り返し算出し、前記第1間隔、前記第2間隔、前記第3間隔の少なくとも3個の間隔毎に算出した音パラメータの算出結果を前記音パラメータ保存部に保存する、
音声モニタリングシステム。 - 請求項1に記載の音声モニタリングシステムであって、
前記音パラメータ表示制御部は、指定された前記時間範囲に応じて、第1間隔毎に前記音パラメータ算出部により算出されて前記音パラメータ保存部に保存された前記音パラメータを用いるか、又は前記レコーダに記録された前記音を基に前記第1間隔より短い間隔毎で前記音パラメータ算出部により音パラメータを算出させて用いるかを選択する、
音声モニタリングシステム。 - 請求項1に記載の音声モニタリングシステムであって、
前記マイクアレイにより収音された音を無効化するための収音除外エリアを設定する除外エリア設定部、を更に備え、
前記音パラメータ算出部は、前記収音除外エリアを音源とする音の音パラメータをゼロとして算出する、
音声モニタリングシステム。 - 請求項1に記載の音声モニタリングシステムであって、
前記モニタに表示された前記音源視覚画像の指定操作に応じて、前記マイクアレイにより収音された音を用いて、前記マイクアレイから、指定された前記音源視覚画像に対応する音源に向かう指向方向の音を強調処理する指向音強調部と、
強調処理された前記指向方向の音を再生してスピーカに出力させる再生制御部と、を更に備える、
音声モニタリングシステム。 - 請求項10に記載の音声モニタリングシステムであって、
前記音パラメータ算出部は、指定された前記時間範囲において、指定された前記音源視覚画像を含む周囲で最も前記音パラメータの累計値が大きい位置を算出し、
前記指向音強調部は、前記マイクアレイから、算出された前記累計値が大きい位置に向かう方向を前記指向方向として、前記マイクアレイにより収音された音を強調処理する、
音声モニタリングシステム。 - 請求項10に記載の音声モニタリングシステムであって、
前記再生制御部は、指定された前記時間範囲の中で、前記マイクアレイにより収音された音から音声が検知された音声検知期間における、前記指向音強調部による強調処理済みの音声を再生する、
音声モニタリングシステム。 - 請求項12に記載の音声モニタリングシステムであって、
前記再生制御部は、指定された前記時間範囲の中で前記音声検知期間が複数検知された場合に、前記音声検知期間の一覧リストを前記モニタに表示し、前記一覧リストから選択された音声検知期間における、前記指向音強調部による強調処理済みの音声を再生する、
音声モニタリングシステム。 - 請求項10に記載の音声モニタリングシステムであって、
前記音パラメータ算出部は、指定された前記時間範囲において、前記マイクアレイにより収音された音から音声が検知された音声検知期間が最も長い時間帯を求め、
前記再生制御部は、前記音声検知期間が最も長い時間帯に前記カメラにより撮像された撮像映像に、前記音源視覚画像を重畳して前記モニタに表示する、
音声モニタリングシステム。 - 請求項1に記載の音声モニタリングシステムであって、
前記時間範囲の指定に応じて、前記音パラメータ保存部に保存された前記音パラメータを基に、前記時間範囲の前記エリアにおける人物の発話傾向を分析する発話分析部、を更に備え、
前記音パラメータ表示制御部は、前記人物の発話傾向の分析結果を前記人物の発話期間と対応付けて前記モニタに表示する、
音声モニタリングシステム。 - 請求項15に記載の音声モニタリングシステムであって、
前記発話分析部は、前記人物の発話傾向として、前記エリアにおいて1人が所定時間以上に発話しているか、又は複数人が前記所定時間未満に発話しているかを分析する、
音声モニタリングシステム。 - 請求項15に記載の音声モニタリングシステムであって、
音パラメータ表示制御部は、前記発話分析部により分析された前記人物の発話内容を吹き出しとして、前記撮像画像中の前記人物に対応付けて前記モニタに表示する、
音声モニタリングシステム。 - 請求項17に記載の音声モニタリングシステムであって、
前記人物の発話内容に対応する音パラメータに基づく前記音源視覚画像が無色である前記撮像画像中の位置を、前記吹き出しの表示位置として決定する吹き出し制御部、を更に備える、
音声モニタリングシステム。 - カメラと、マイクアレイと、レコーダと、再生制御装置とを含む音声モニタリングシステムにおける音声モニタリング方法であって、
前記カメラは、モニタリング対象のエリアを撮像し、
前記マイクアレイは、前記エリアの音を収音し、
前記レコーダは、前記カメラにより撮像された撮像画像及び撮像時刻と前記マイクアレイにより収音された音とを対応付けて記録し、
前記再生制御装置は、前記カメラの撮像中に前記マイクアレイにより収音された音を基に、撮像時刻における前記エリアの音の大きさを示す音パラメータを、前記撮像画像を構成する画素の所定単位毎に繰り返して算出し、
前記再生制御装置は、算出された前記音パラメータを、前記撮像時刻における撮像画像上の位置情報を対応付けて前記レコーダに保存し、
前記再生制御装置は、前記音パラメータに基づく音源視覚画像を、前記撮像画像を構成する画素の所定単位毎に重畳してモニタすることを特徴とし、
前記再生制御装置は、時間範囲の指定に応じて、前記レコーダに保存された前記音パラメータの前記時間範囲における累計値に基づく前記音源視覚画像を、前記撮像画像を構成する画素の所定単位毎に重畳して前記モニタに表示する、
音声モニタリング方法。
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016148470A JP6739041B2 (ja) | 2016-07-28 | 2016-07-28 | 音声モニタリングシステム及び音声モニタリング方法 |
| US16/320,338 US10930295B2 (en) | 2016-07-28 | 2017-06-06 | Voice monitoring system and voice monitoring method |
| PCT/JP2017/020900 WO2018020841A1 (ja) | 2016-07-28 | 2017-06-06 | 音声モニタリングシステム及び音声モニタリング方法 |
| US17/175,220 US11631419B2 (en) | 2016-07-28 | 2021-02-12 | Voice monitoring system and voice monitoring method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016148470A JP6739041B2 (ja) | 2016-07-28 | 2016-07-28 | 音声モニタリングシステム及び音声モニタリング方法 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2018019263A true JP2018019263A (ja) | 2018-02-01 |
| JP2018019263A5 JP2018019263A5 (ja) | 2019-09-12 |
| JP6739041B2 JP6739041B2 (ja) | 2020-08-12 |
Family
ID=61017359
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016148470A Active JP6739041B2 (ja) | 2016-07-28 | 2016-07-28 | 音声モニタリングシステム及び音声モニタリング方法 |
Country Status (3)
| Country | Link |
|---|---|
| US (2) | US10930295B2 (ja) |
| JP (1) | JP6739041B2 (ja) |
| WO (1) | WO2018020841A1 (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2020036377A1 (ko) * | 2018-08-16 | 2020-02-20 | 한화테크윈 주식회사 | 시각화된 객체에서 특정영역의 소리를 추출하는 감시 카메라 시스템 및 그 동작 방법 |
| KR102210041B1 (ko) * | 2019-10-01 | 2021-02-01 | (주)에스엠인스트루먼트 | Cctv 연계형 음향 시각화 시스템 |
| JP2022040819A (ja) * | 2020-08-31 | 2022-03-11 | 日産自動車株式会社 | 画像処理装置及び画像処理方法 |
| US11462235B2 (en) | 2018-08-16 | 2022-10-04 | Hanwha Techwin Co., Ltd. | Surveillance camera system for extracting sound of specific area from visualized object and operating method thereof |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2018034059A1 (ja) * | 2016-08-17 | 2018-02-22 | パナソニックIpマネジメント株式会社 | 音声入力装置、翻訳装置、音声入力方法、及び音声入力プログラム |
| CN107566743B (zh) * | 2017-10-30 | 2019-10-11 | 珠海市一微半导体有限公司 | 移动机器人的视频监控方法 |
| US20220084687A1 (en) * | 2018-12-21 | 2022-03-17 | Essilor International | A method and device for predicting evolution over time of a vision-related parameter |
| US20220167083A1 (en) * | 2019-04-19 | 2022-05-26 | Sony Group Corporation | Signal processing apparatus, signal processing method, program, and directivity variable system |
| CN110441737B (zh) * | 2019-08-26 | 2023-02-24 | 上海声茵科技有限公司 | 一种采用鱼眼镜头的声源定位方法及其设备 |
| WO2022201069A1 (en) * | 2021-03-24 | 2022-09-29 | Sony Group Corporation | Information processing device, information processing method, and program |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002186084A (ja) * | 2000-12-14 | 2002-06-28 | Matsushita Electric Ind Co Ltd | 指向性収音装置、音源方向推定装置および音源方向推定システム |
| JP2010203800A (ja) * | 2009-02-27 | 2010-09-16 | Kumagai Gumi Co Ltd | 音源の推定方法とその装置 |
| JP2010206419A (ja) * | 2009-03-02 | 2010-09-16 | Kumagai Gumi Co Ltd | 音源の推定方法とその装置 |
| US20150006176A1 (en) * | 2013-06-27 | 2015-01-01 | Rawles Llc | Detecting Self-Generated Wake Expressions |
| WO2016098315A1 (ja) * | 2014-12-15 | 2016-06-23 | パナソニックIpマネジメント株式会社 | マイクアレイ、監視システム及び収音設定方法 |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8089563B2 (en) * | 2005-06-17 | 2012-01-03 | Fuji Xerox Co., Ltd. | Method and system for analyzing fixed-camera video via the selection, visualization, and interaction with storyboard keyframes |
| JP2008262046A (ja) * | 2007-04-12 | 2008-10-30 | Hitachi Ltd | 会議可視化システム、会議可視化方法、及び集計処理サーバ |
| US8363512B2 (en) * | 2009-02-27 | 2013-01-29 | Honda Motors | Method and apparatus for estimating sound source |
| US11120818B2 (en) * | 2010-11-12 | 2021-09-14 | Nokia Technologies Oy | Processing audio with a visual representation of an audio source |
| JP5857674B2 (ja) * | 2010-12-22 | 2016-02-10 | 株式会社リコー | 画像処理装置、及び画像処理システム |
| US8972265B1 (en) * | 2012-06-18 | 2015-03-03 | Audible, Inc. | Multiple voices in audio content |
| US9679564B2 (en) * | 2012-12-12 | 2017-06-13 | Nuance Communications, Inc. | Human transcriptionist directed posterior audio source separation |
| US20150348538A1 (en) * | 2013-03-14 | 2015-12-03 | Aliphcom | Speech summary and action item generation |
| US9706168B1 (en) * | 2014-10-13 | 2017-07-11 | Surround.IO | Room conferencing system with heat map annotation of documents |
| US10909384B2 (en) * | 2015-07-14 | 2021-02-02 | Panasonic Intellectual Property Management Co., Ltd. | Monitoring system and monitoring method |
| WO2017163688A1 (en) * | 2016-03-24 | 2017-09-28 | Panasonic Intellectual Property Management Co., Ltd. | Monitoring system and monitoring method |
| US10276143B2 (en) * | 2017-09-20 | 2019-04-30 | Plantronics, Inc. | Predictive soundscape adaptation |
-
2016
- 2016-07-28 JP JP2016148470A patent/JP6739041B2/ja active Active
-
2017
- 2017-06-06 US US16/320,338 patent/US10930295B2/en active Active
- 2017-06-06 WO PCT/JP2017/020900 patent/WO2018020841A1/ja not_active Ceased
-
2021
- 2021-02-12 US US17/175,220 patent/US11631419B2/en active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002186084A (ja) * | 2000-12-14 | 2002-06-28 | Matsushita Electric Ind Co Ltd | 指向性収音装置、音源方向推定装置および音源方向推定システム |
| JP2010203800A (ja) * | 2009-02-27 | 2010-09-16 | Kumagai Gumi Co Ltd | 音源の推定方法とその装置 |
| JP2010206419A (ja) * | 2009-03-02 | 2010-09-16 | Kumagai Gumi Co Ltd | 音源の推定方法とその装置 |
| US20150006176A1 (en) * | 2013-06-27 | 2015-01-01 | Rawles Llc | Detecting Self-Generated Wake Expressions |
| WO2016098315A1 (ja) * | 2014-12-15 | 2016-06-23 | パナソニックIpマネジメント株式会社 | マイクアレイ、監視システム及び収音設定方法 |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2020036377A1 (ko) * | 2018-08-16 | 2020-02-20 | 한화테크윈 주식회사 | 시각화된 객체에서 특정영역의 소리를 추출하는 감시 카메라 시스템 및 그 동작 방법 |
| US11462235B2 (en) | 2018-08-16 | 2022-10-04 | Hanwha Techwin Co., Ltd. | Surveillance camera system for extracting sound of specific area from visualized object and operating method thereof |
| KR102210041B1 (ko) * | 2019-10-01 | 2021-02-01 | (주)에스엠인스트루먼트 | Cctv 연계형 음향 시각화 시스템 |
| JP2022040819A (ja) * | 2020-08-31 | 2022-03-11 | 日産自動車株式会社 | 画像処理装置及び画像処理方法 |
| JP7612359B2 (ja) | 2020-08-31 | 2025-01-14 | 日産自動車株式会社 | 画像処理装置及び画像処理方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20210166711A1 (en) | 2021-06-03 |
| US11631419B2 (en) | 2023-04-18 |
| US20190272830A1 (en) | 2019-09-05 |
| WO2018020841A1 (ja) | 2018-02-01 |
| US10930295B2 (en) | 2021-02-23 |
| JP6739041B2 (ja) | 2020-08-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6739041B2 (ja) | 音声モニタリングシステム及び音声モニタリング方法 | |
| US20230071638A1 (en) | System and method for differentially locating and modifying audio sources | |
| US9973846B2 (en) | Microphone array, monitoring system, and sound pickup setting method | |
| KR101238586B1 (ko) | 녹화된 미팅 타임라인에서 사용하기 위한 자동 얼굴 추출 | |
| US8804033B2 (en) | Preservation/degradation of video/audio aspects of a data stream | |
| US9942511B2 (en) | Preservation/degradation of video/audio aspects of a data stream | |
| GB2342802A (en) | Indexing conference content onto a timeline | |
| US20050220309A1 (en) | Sound reproduction apparatus, sound reproduction system, sound reproduction method and control program, and information recording medium for recording the program | |
| CN111866421A (zh) | 会议记录系统与会议记录方法 | |
| US20070100533A1 (en) | Preservation and/or degradation of a video/audio data stream | |
| US20180158446A1 (en) | Directionality control system and sound output control method | |
| US20070100860A1 (en) | Preservation and/or degradation of a video/audio data stream | |
| JP2016152557A (ja) | 収音システム及び収音設定方法 | |
| JP6456171B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
| JP2017147697A (ja) | 情報処理装置、情報処理方法およびプログラム | |
| JP2013183280A (ja) | 情報処理装置、撮像装置、及びプログラム | |
| WO2017026387A1 (ja) | 映像処理装置、映像処理方法および記録媒体 | |
| JP6392578B2 (ja) | 音声処理装置、音声処理方法、及び音声処理プログラム | |
| JP4805496B2 (ja) | 被保護者映像配信装置、保護者音声ファイル配信装置、保護者画像ファイル配信装置および保護者端末接続装置 | |
| JP2025005647A (ja) | 会議装置、機器システム、エコー抑制方法、プログラム | |
| KR20250033633A (ko) | 반응형 디지털 컨텐츠 제공시스템 | |
| JP2005045843A (ja) | 動画像の変化点検出方法及び装置 | |
| JP2021064870A (ja) | 情報処理装置、情報処理システム、情報処理方法およびプログラム | |
| JPWO2018074263A1 (ja) | 情報処理装置、情報処理方法、プログラム、およびコミュニケーションシステム | |
| JP2016118713A (ja) | 音声分析装置及び音声分析システム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190729 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190729 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200602 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200702 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 6739041 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |