JP2015012530A - Electronic apparatus, control method therefor, and program - Google Patents
Electronic apparatus, control method therefor, and program Download PDFInfo
- Publication number
- JP2015012530A JP2015012530A JP2013137949A JP2013137949A JP2015012530A JP 2015012530 A JP2015012530 A JP 2015012530A JP 2013137949 A JP2013137949 A JP 2013137949A JP 2013137949 A JP2013137949 A JP 2013137949A JP 2015012530 A JP2015012530 A JP 2015012530A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- audio signal
- correlation value
- electronic device
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
本発明は、電子機器、その制御方法及びプログラムに関し、特に、マイクロホンを備える電子機器、その制御方法及びプログラムに関する。 The present invention relates to an electronic device, a control method thereof, and a program, and more particularly, to an electronic device including a microphone, a control method thereof, and a program thereof.
電話等の通話時に、通話先の相手に音声を伝えたくない時に、通話者が、マイクロホンの入力音孔部を指で塞ぐ場合がある。 When it is not desired to convey voice to the other party during a call such as a telephone call, the caller may block the input sound hole of the microphone with a finger.
特許文献1においては、指の接触を検出する接触検出部を備え、接触検出部が指の接触を検出した場合、マイクロホンから入力された音声にミュートをかけるように制御する携帯電話装置が開示されている。特に、特許文献1において、マイクロホンに指が接触した場合に、音声にミュートをかけるように、マイクロホン近傍に、上記の接触検出部を設置した携帯電話装置が開示されている。
なお、上記先行技術文献の開示を、本書に引用をもって繰り込むものとする。以下の分析は、本発明の観点からなされたものである。 The disclosure of the above prior art document is incorporated herein by reference. The following analysis has been made from the viewpoint of the present invention.
通話者がマイクロホンの入力音孔部を指で塞いだ場合、指と、入力音孔部との摩擦音が、通話先の相手に伝わってしまう場合がある。また、入力音孔部を塞いでも、指と、入力音孔部との隙間から、通話先の相手に音声が伝わってしまう場合がある。 When the caller blocks the input sound hole of the microphone with a finger, the frictional sound between the finger and the input sound hole may be transmitted to the other party. In addition, even if the input sound hole portion is closed, the voice may be transmitted to the other party through the gap between the finger and the input sound hole portion.
ここで、特許文献1に開示された技術では、指以外の物体が、接触検出部に接触した場合であっても、マイクロホンから入力された音声にミュートをかける恐れがある。例えば、通話先の相手に音声を聞こえやすくするために、通話者が、マイクロホンに口を接触させて、通話する場合がある。しかし、特許文献1に開示された技術では、接触検出部に口が接触した場合、ユーザが意図しない不適切なタイミングで、音声にミュートをかける恐れがある。
Here, with the technique disclosed in
そこで、本発明は、ユーザの自然な所作に基づいて、適切に出力音声信号を制御することに寄与する電子機器、その制御方法及びプログラムを提供することを目的とする。 Therefore, an object of the present invention is to provide an electronic device that contributes to appropriately controlling an output audio signal based on a user's natural actions, a control method thereof, and a program.
本発明の第1の視点によれば、音声信号を入力する音声入力部と、前記音声信号に基づいて、信号変化特徴量を抽出する特徴量抽出部と、予め登録された第1の前記信号変化特徴量と、前記音声信号から抽出された第2の前記信号変化特徴量との相関値を算出する相関値算出部と、前記相関値に基づいて、出力音声信号を制御する出力音声制御部と、を備える電子機器が提供される。 According to the first aspect of the present invention, an audio input unit that inputs an audio signal, a feature amount extraction unit that extracts a signal change feature amount based on the audio signal, and the first signal registered in advance A correlation value calculation unit that calculates a correlation value between a change feature quantity and the second signal change feature quantity extracted from the voice signal, and an output voice control unit that controls an output voice signal based on the correlation value Are provided.
本発明の第2の視点によれば、音声信号を入力する工程と、前記音声信号に基づいて、信号変化特徴量を抽出する特徴量抽出工程と、予め登録された第1の前記信号変化特徴量と、前記音声信号から抽出された第2の前記信号変化特徴量との相関値を算出する工程と、前記相関値に基づいて、出力音声信号を制御する出力音声制御工程と、を含む電子機器の制御方法が提供される。
なお、本方法は、音声信号を制御する電子機器という、特定の機械に結び付けられている。
According to a second aspect of the present invention, a step of inputting an audio signal, a feature amount extracting step of extracting a signal change feature amount based on the audio signal, and a first signal change feature registered in advance. A step of calculating a correlation value between the amount and the second signal variation feature amount extracted from the voice signal, and an output voice control step of controlling an output voice signal based on the correlation value An apparatus control method is provided.
Note that this method is linked to a specific machine, which is an electronic device that controls an audio signal.
本発明の第3の視点によれば、電子機器を制御するコンピュータに実行させるプログラムであって、音声信号を入力する処理と、前記音声信号に基づいて、信号変化特徴量を抽出する特徴量抽出処理と、予め登録された第1の前記信号変化特徴量と、前記音声信号から抽出された第2の前記信号変化特徴量との相関値を算出する処理と、前記相関値に基づいて、出力音声信号を制御する出力音声制御処理と、を実行するプログラムが提供される。
なお、本プログラムは、コンピュータが読み取り可能な記憶媒体に記録することができる。記憶媒体は、半導体メモリ、ハードディスク、磁気記録媒体、光記録媒体等の非トランジェント(non-transient)なものとすることができる。本発明は、コンピュータプログラム製品として具現することも可能である。
According to a third aspect of the present invention, there is provided a program that is executed by a computer that controls an electronic device, the process of inputting an audio signal, and the feature quantity extraction that extracts a signal change feature quantity based on the audio signal Processing, processing for calculating a correlation value between the first signal change feature value registered in advance and the second signal change feature value extracted from the audio signal, and output based on the correlation value An output audio control process for controlling the audio signal is provided.
The program can be recorded on a computer-readable storage medium. The storage medium may be non-transient such as a semiconductor memory, a hard disk, a magnetic recording medium, an optical recording medium, or the like. The present invention can also be embodied as a computer program product.
本発明の各視点によれば、ユーザの自然な所作に基づいて、適切に出力音声信号を制御することに寄与する電子機器、その制御方法及びプログラムが提供される。 According to each aspect of the present invention, an electronic device that contributes to appropriately controlling an output audio signal based on a user's natural actions, a control method thereof, and a program are provided.
初めに、図1を用いて一実施形態の概要について説明する。なお、この概要に付記した図面参照符号は、理解を助けるための一例として各要素に便宜上付記したものであり、この概要の記載はなんらの限定を意図するものではない。 First, an outline of an embodiment will be described with reference to FIG. Note that the reference numerals of the drawings attached to the outline are attached to the respective elements for convenience as an example for facilitating understanding, and the description of the outline is not intended to be any limitation.
上述の通り、ユーザの自然な所作に基づいて、適切に出力音声信号を制御することに寄与する電子機器が望まれる。 As described above, an electronic device that contributes to appropriately controlling an output audio signal based on a user's natural actions is desired.
そこで、一例として、図1に示す電子機器100を提供する。図1(a)は、電子機器100の内部構成の一例を示すブロック図である。図1(b)は、電子機器100の処理の一例を示すフローチャートである。電子機器100は、音声入力部101と、特徴量抽出部102と、相関値算出部103と、出力音声制御部104と、を備える。
Therefore, as an example, the electronic device 100 illustrated in FIG. 1 is provided. FIG. 1A is a block diagram illustrating an example of an internal configuration of the electronic device 100. FIG. 1B is a flowchart illustrating an example of processing of the electronic device 100. The electronic device 100 includes an
まず、音声入力部101は、音声信号を入力する(ステップS1001)。そして、特徴量抽出部102は、音声信号に基づいて、信号変化特徴量を抽出する(ステップS1002)。信号変化特徴量とは、音声信号の変化を表す特徴量を意味する。例えば、信号変化特徴量は、周波数領域における、音声信号のエネルギーの変化量であっても良い。
First, the
そして、相関値算出部103は、予め登録された第1の信号変化特徴量と、音声信号から抽出された第2の信号変化特徴量との相関値を算出する(ステップS1003)。そして、出力音声制御部104は、相関値に基づいて、出力音声信号を制御する(ステップS1004)。例えば、出力音声制御部104は、相関値が所定の閾値を超える場合、出力音声信号をミュート等しても良い。
Then, the correlation
例えば、特徴量抽出部102は、マイクロホン(音声入力部101に相当)の入力音孔部を、指で塞いだ時の音声信号の変化に関する特徴量を、第1の信号変化特徴量として抽出したとする。そして、特徴量抽出部102が第1の信号変化特徴量を登録後に、音声入力部101は、新たな音声信号を入力したとする。そして、特徴量抽出部102は、入力された音声信号の所定の時間での変化に関する特徴量を、第2の信号変化特徴量として抽出したとする。
For example, the feature
その場合、相関値算出部103は、入力された音声信号の所定の時間での変化に関する特徴量(第2の信号変化特徴量)と、マイクロホンの入力音孔部を塞いだ時の音声信号の変化に関する特徴量(第1の信号変化特徴量)との相関値を算出する。そして、出力音声制御部104は、算出された相関値に基づいて、出力音声信号を制御する。例えば、相関値が所定の閾値を超える場合、入力された音声信号が、マイクロホンの入力音孔部を塞がれた状態で入力された音声信号であると、出力音声制御部104は判断しても良い。そして、その場合、出力音声制御部104は、出力音声信号をミュート等しても良い。従って、電子機器100は、ユーザの自然な所作に基づいて、適切に出力音声信号を制御することに寄与する。
In this case, the correlation
[第1の実施形態]
第1の実施形態について、図面を用いてより詳細に説明する。
[First Embodiment]
The first embodiment will be described in more detail with reference to the drawings.
図2は、本実施形態に係る電子機器1の全体構成の一例を示す図である。電子機器1は、マイクロホン11と、レシーバ12と、スピーカ13と、操作部14と、表示部15と、を含んで構成される。なお、図2は、電子機器1を図2で示す形態に限定する趣旨ではない。例えば、電子機器1は、携帯電話、スマートフォン、ゲーム機、タブレットPC、PDA(Personal Data Assistants:携帯情報端末)等であっても良い。電子機器1は、マイクロホン11を備え、マイクロホン11から入力された音声信号を出力する電子機器であるとしても良い。
FIG. 2 is a diagram illustrating an example of the overall configuration of the
マイクロホン11は、上記の音声入力部101に相当し、音声信号を入力する。つまり、電子機器1は、マイクロホン11から外部の音声を入力する。例えば、マイクロホン11は、送話等に用いる。
The
レシーバ12は、通話処理時の受話音等の音声を出力する。ユーザは、レシーバ12に耳を押し当てて(近づけて)、レシーバ12からの出力される音声を聞く。 The receiver 12 outputs a sound such as a received sound during the call processing. The user presses the ear against the receiver 12 (closes it) and listens to the sound output from the receiver 12.
スピーカ13は、着信音等の音声を出力する。 The speaker 13 outputs sound such as a ring tone.
操作部14は、ユーザの操作を受け付けるキー、ボタン等である。例えば、ユーザは、操作部14を介して、通話処理を開始、終了する。
The
表示部15は、電子機器1の動作に関係する情報を表示する。例えば、通話アプリケーションが起動している場合(通話中である場合)、表示部15は、通話先の電話番号、ミュートの有無等の情報を表示しても良い。表示部15は、液晶パネル、有機EL(Electro Luminescence)パネル等であっても良い。
The
図3は、本実施形態に係る電子機器1の内部構成の一例を示すブロック図である。電子機器1は、マイクロホン11と、レシーバ12と、スピーカ13と、操作部14と、表示部15と、マイクロホンアンプ16と、A/D(Analog To Digital)変換器17と、記憶部18と、制御部20と、符号化・複合部30と、通信部40と、スピーカアンプ50と、を含んで構成される。制御部20は、特徴量抽出部21と、相関値算出部22と、出力音声制御部23と、を含んで構成される。図3は、簡単のため、本実施形態に関係するモジュールを主に記載する。
FIG. 3 is a block diagram illustrating an example of an internal configuration of the
マイクロホン11は、入力音孔部(図示せず)を含む。そして、マイクロホン11は、入力音孔部を介して、音声信号を入力する。具体的には、マイクロホン11は、入力音孔部を介して、アナログ音声信号を入力する。そして、マイクロホン11は入力されたアナログ音声信号をマイクロホンアンプ16に対して出力する。
The
マイクロホンアンプ16は、マイクロホン11から出力されたアナログ音声信号を増幅する。そして、マイクロホンアンプ16は、増幅されたアナログ音声信号をA/D変換器17に対して出力する。
The microphone amplifier 16 amplifies the analog audio signal output from the
A/D変換器17は、マイクロホンアンプ16から入力されたアナログ音声信号を、デジタル音声信号に変換する。そして、A/D変換器17は、デジタル音声信号を制御部20に対して出力する。具体的には、A/D変換器17は、デジタル音声信号を特徴量抽出部21に対して出力する。
The A /
記憶部18は、電子機器1の動作に必要な情報を記憶する。例えば、記憶部18は、第1の信号変化特徴量を記憶する。
The storage unit 18 stores information necessary for the operation of the
制御部20は、電子機器1の全体を制御すると共に、図3に示す各部を制御する。制御部20は、電子機器1に搭載されたコンピュータに、そのハードウェアを用いて、電子機器1の処理を実行させるコンピュータプログラムにより実現することもできる。
The control unit 20 controls the entire
また、制御部20は、第1の信号変化特徴量を学習する動作モードと、入力された音声信号をミュートする動作モードと、を制御する。以下の説明では、第1の信号変化特徴量を学習する動作モードを、学習モードと呼ぶ。また、以下の説明では、入力された音声信号をミュートする動作モードを、出力音声制御モードと呼ぶ。 Further, the control unit 20 controls an operation mode for learning the first signal change feature amount and an operation mode for muting the input audio signal. In the following description, the operation mode for learning the first signal change feature amount is referred to as a learning mode. In the following description, an operation mode for muting an input audio signal is referred to as an output audio control mode.
特徴量抽出部21は、音声信号に基づいて、信号変化特徴量を抽出する。具体的には、特徴量抽出部21は、A/D変換器17から入力されたデジタル音声信号に基づいて、信号変化特徴量を抽出する。
The feature
より具体的には、特徴量抽出部21は、所定の帯域の音声信号のエネルギーの変化量を、信号変化特徴量として抽出する。ここで、特徴量抽出部21は、所定の時間(例えば、10ミリ秒〜100ミリ秒程度)の音声信号に基づいて、信号変化特徴量を抽出することが好ましい。なぜなら、音声信号のエネルギーの変化量を算出するためには、所定の時間の音声信号が必要となるからである。
More specifically, the feature
例えば、動作モードが学習モードの場合に、ユーザは、指等で、マイクロホン11の入力音孔部を塞いでも良い。そして、特徴量抽出部21は、入力音孔部が開放された状態(以下、音孔開放状態と呼ぶ)から、入力音孔部が塞がれた状態(以下、音孔閉塞状態と呼ぶ)に遷移した場合の、所定の帯域の音声信号のエネルギーの変化量を、第1の信号変化特徴量として抽出することが好ましい。
For example, when the operation mode is the learning mode, the user may block the input sound hole portion of the
ここで、音孔開放状態から音孔閉塞状態に遷移した場合、音声信号に含まれる背景雑音のエネルギーが減衰する。ここで、背景雑音は、所謂ホワイトノイズである場合が多い。そのため、音孔開放状態から音孔閉塞状態に遷移した場合、低周波数領域から高周波数領域までの全周波数領域において、音声信号のエネルギーが減衰する場合が多い。なお、ホワイトノイズとは、低周波数領域から高周波数領域までの全周波数領域において、エネルギーの変動が所定の範囲内に抑制された信号を意味する。 Here, when the sound hole is opened to the sound hole closed state, the background noise energy included in the sound signal is attenuated. Here, the background noise is often so-called white noise. Therefore, when the sound hole is opened to the sound hole closed state, the energy of the audio signal is often attenuated in the entire frequency region from the low frequency region to the high frequency region. White noise means a signal in which energy fluctuation is suppressed within a predetermined range in the entire frequency region from the low frequency region to the high frequency region.
そこで、特徴量抽出部21は、音孔開放状態から音孔閉塞状態に遷移した場合の、低周波数領域から高周波数領域までの所定の帯域における、デジタル音声信号のエネルギーの変化量を算出する。そして、特徴量抽出部21は、算出されたエネルギーの変化量を、第1の信号変化特徴量として抽出する。そして、動作モードが学習モードである場合、特徴量抽出部21は、抽出した第1の信号変化特徴量を記憶部18に対して出力する。
Therefore, the feature
一方、動作モードが出力音声制御モードの場合、特徴量抽出部21は、所定の時間での所定の帯域の音声信号のエネルギーの変化量を、第2の信号変化特徴量として抽出する。具体的には、動作モードが出力音声制御モードの場合、特徴量抽出部21は、所定の時間での低周波数領域から高周波数領域までの所定の帯域における、デジタル音声信号のエネルギーの変化量を算出しても良い。そして、特徴量抽出部21は、算出されたエネルギーの変化量を、第2の信号変化特徴量として抽出してもよい。一方、動作モードが出力音声制御モードである場合、特徴量抽出部21は、抽出した第2の信号変化特徴量を、相関値算出部22に対して出力する。
On the other hand, when the operation mode is the output voice control mode, the feature
相関値算出部22は、予め登録された第1の信号変化特徴量と、音声信号から抽出された第2の信号変化特徴量と、の相関値を算出する。具体的には、相関値算出部22は、記憶部18が記憶する第1の信号変化特徴量と、特徴量抽出部21が出力する第2の信号変化特徴量と、の相関値を算出する。
The correlation value calculation unit 22 calculates a correlation value between the first signal change feature value registered in advance and the second signal change feature value extracted from the audio signal. Specifically, the correlation value calculation unit 22 calculates a correlation value between the first signal change feature value stored in the storage unit 18 and the second signal change feature value output from the feature
出力音声制御部23は、出力音声信号を制御する。具体的には、出力音声制御部23は、相関値算出部22の算出した相関値に基づいて、入力された音声信号をミュートするか否かを判断する。より具体的には、出力音声制御部23は、相関値算出部22の算出した相関値が、所定の閾値を超える場合、入力された音声信号をミュートする。
The output
また、出力音声制御部23は、入力された音声信号をミュートした状態において、相関値が所定の閾値以下となる場合、入力された音声信号のミュートを解除しても良い。そして、出力音声制御部23は、入力されたデジタル音声信号を、符号化・複合部30に対して出力する。
In addition, the output
符号化・複合部30は、音声信号の符号化処理、又は複合処理を行う。具体的には、符号化・複合部30は、出力音声制御部23から入力されたデジタル音声信号を符号化する。そして、符号化・複合部30は、符号化された音声信号を、通信部40に対して出力する。
The encoding / compositing
通信部40は、通信網を介して、音声信号を送受信する。ここで、通信回線は、公衆電話網、携帯電話網、インターネット、LAN(Local Area Network)等、各種あるが、その詳細は問わない。また、通信方法は、有線、無線を問わない。 The communication unit 40 transmits and receives audio signals via a communication network. Here, there are various types of communication lines such as a public telephone network, a mobile phone network, the Internet, and a LAN (Local Area Network), but the details are not limited. The communication method may be wired or wireless.
符号化・複合部30から通信部40に音声信号が入力された場合、通信部40は、通信網を介して、通信相手に音声信号を送信する。また、通信部40は、通信網を介して、符号化されたデジタル音声信号を受信する。そして、通信部40は、符号化・複合部30に対して、受信したデジタル音声信号を出力する。そして、符号化・複合部30は、通信部40から入力されたデジタル音声信号を、アナログ音声信号に変換する。そして、符号化・複合部30は、レシーバ12に対してアナログ音声信号を出力する。
When an audio signal is input from the encoding / combining
スピーカアンプ50は、符号化・複合部30からアナログ音声信号が入力された場合、入力されたアナログ音声信号を増幅する。そして、スピーカアンプ50は、増幅されたアナログ音声信号を、スピーカ13に対して出力する。
When an analog audio signal is input from the encoding / combining
次に、電子機器1の動作について説明する。
Next, the operation of the
図4は、入力された音声信号をミュートする処理の一例を示すフローチャートである。 FIG. 4 is a flowchart illustrating an example of a process for muting an input audio signal.
ステップS1において、通信部40が通話処理を開始したか否かを、制御部20は判断する。通信部40が通話処理を開始した場合(ステップS1のYes分岐)には、ステップS2に遷移する。一方、通信部40が通話処理を開始していない場合(ステップS1のNo分岐)には、制御部20は、通信部40が通話処理を開始したか否かの判断(ステップS1)を繰り返す。 In step S1, the control unit 20 determines whether or not the communication unit 40 has started a call process. When the communication unit 40 starts the call process (Yes branch in step S1), the process proceeds to step S2. On the other hand, when the communication unit 40 has not started the call process (No branch in step S1), the control unit 20 repeats the determination whether the communication unit 40 has started the call process (step S1).
ステップS2において、マイクロホン11からアナログ音声信号が入力されたか否かを、制御部20は判断する。マイクロホン11からアナログ音声信号が入力された場合(ステップS2のYes分岐)には、ステップS4に遷移する。一方、マイクロホン11からアナログ音声信号が入力されていない場合(ステップS2のNo分岐)には、ステップS3に遷移する。
In step S <b> 2, the control unit 20 determines whether an analog audio signal is input from the
ステップS3において、通信部40が通話処理を終了したか否かを、制御部20は判断する。通信部40が通話処理を終了した場合(ステップS3のYes分岐)には、電子機器1は、出力音声信号を制御する処理を終了する。一方、通信部40が通話処理を終了していない場合(ステップS3のNo分岐)には、ステップS2に戻り、処理を継続する。
In step S3, the control unit 20 determines whether or not the communication unit 40 has finished the call process. When the communication unit 40 ends the call process (Yes branch in step S3), the
一方、マイクロホン11からアナログ音声信号が入力された場合(ステップS2のYes分岐)には、マイクロホンアンプ16は、アナログ音声信号を増幅する(ステップS4)。そして、ステップS5において、A/D変換器17は、増幅されたアナログ音声信号をデジタル音声信号に変換する。
On the other hand, when an analog audio signal is input from the microphone 11 (Yes branch in step S2), the microphone amplifier 16 amplifies the analog audio signal (step S4). In step S5, the A /
ステップS6において、特徴量抽出部21は、デジタル音声信号から信号変化特徴量を抽出する。
In step S6, the feature
ステップS7において、相関値算出部22は、予め登録された第1の信号変化特徴量と、デジタル音声信号から抽出された第2の信号変化特徴量との相関値を算出する。 In step S7, the correlation value calculation unit 22 calculates a correlation value between the first signal change feature value registered in advance and the second signal change feature value extracted from the digital audio signal.
ステップS8において、予め登録された第1の信号変化特徴量と、デジタル音声信号から抽出された第2の信号変化特徴量との相関値が所定の閾値を超えるか否かを、出力音声制御部23は判断する。 In step S8, it is determined whether or not the correlation value between the first signal change feature value registered in advance and the second signal change feature value extracted from the digital audio signal exceeds a predetermined threshold value. 23 is judged.
相関値が所定の閾値を超える場合(ステップS8のYes分岐)には、出力音声制御部23は、入力された音声信号をミュートする(ステップS9)。そして、ステップS2に戻り、処理を継続する。
If the correlation value exceeds a predetermined threshold (Yes branch in step S8), the output
一方、相関値が所定の閾値を超えない場合(ステップS8のNo分岐)には、出力音声制御部23は、入力された音声信号をミュートせず、通話状態を維持する(ステップS10)。そして、ステップS2に戻り、処理を継続する。
On the other hand, when the correlation value does not exceed the predetermined threshold (No branch in step S8), the output
以上のように、本実施形態に係る電子機器1は、所定の時間での音声信号の変化量に基づいて、入力された音声信号をミュートするか否かを判断する。例えば、電話等において、マイクロホンの入力音孔部を指で塞いで、マイクロホンから入力される音声を、通話先の相手に伝えないようにする場合がある。そこで、本実施形態に係る電子機器1は、予め登録した音声信号の変化量に基づいて、入力音孔部がユーザの指等で塞がれた状態であるか否かを判断する。そして、本実施形態に係る電子機器1は、入力音孔部がユーザの指等で塞がれた状態であると判断した場合、入力された音声信号をミュートする。従って、本実施形態に係る電子機器1は、ユーザの自然な所作に基づいて、適切に出力音声信号を制御することに寄与する。
As described above, the
[第2の実施形態]
第2の実施形態について、詳細に説明する。
[Second Embodiment]
The second embodiment will be described in detail.
本実施形態は、ユーザの意図しない場合に、入力された音声信号をミュートする可能性を低減する形態である。なお、本実施形態における説明では、上記の実施形態と重複する部分の説明は省略する。さらに、本実施形態における説明では、上記の実施形態と同一の構成要素には、同一の符号を付し、その説明を省略する。 This embodiment is a form that reduces the possibility of muting the input audio signal when the user does not intend. In the description of the present embodiment, the description of the same part as the above embodiment is omitted. Further, in the description of the present embodiment, the same components as those of the above-described embodiment are denoted by the same reference numerals, and the description thereof is omitted.
本実施形態に係る電子機器1の内部構成は、図3に示すとおりであるため、詳細な説明は省略する。
Since the internal configuration of the
ユーザが指等でマイクロホン11の入力音孔部を塞いでいる間であっても、相関値算出部22の算出する相関値が、所定の閾値を超える状態を繰り返す場合が多い。なぜなら、ユーザが指等でマイクロホン11の入力音孔部を塞いだ場合、指と、入力音孔部との隙間が生じるためである。
Even while the user is closing the input sound hole of the
そこで、本実施形態に係る出力音声制御部23は、所定の時間で、所定の回数を超えて、相関値算出部22の算出する相関値が、所定の閾値を超えるか否かを判断する。そして、本実施形態に係る出力音声制御部23は、所定の時間で、所定の回数を超えて、相関値算出部22の算出する相関値が、所定の閾値を超える場合、入力された音声信号をミュートする。
Therefore, the output
一方、ユーザがマイクロホン11の入力音孔部をなぞった場合であっても、音声信号のエネルギーは変化する。そして、その場合の信号変化特徴量と、予め登録された第1の信号変化特徴量との相関値が、所定の閾値を超える恐れがある。しかし、ユーザがマイクロホン11の入力音孔部をなぞった場合、相関値算出部22の算出する相関値が、所定の閾値を超える回数は制限される。つまり、ユーザがマイクロホン11の入力音孔部をなぞった場合、相関値算出部22の算出する相関値が、所定の閾値を超える状態を繰り返さない。
On the other hand, even when the user traces the input sound hole portion of the
そのため、本実施形態に係る電子機器1は、指等でマイクロホン11の入力音孔部が塞がれる場合と、マイクロホン11の入力音孔部がなぞられる場合と、を区別できる。その結果、本実施形態に係る電子機器1は、ユーザがマイクロホン11の入力音孔部をなぞったときに、入力された音声信号をミュートすることを防止できる。従って、本実施形態に係る電子機器1は、ユーザの意図しない場合に、入力された音声信号をミュートする可能性を低減することに寄与する。つまり、本実施形態に係る電子機器1は、より一層、ユーザの自然な所作に基づいて、適切に出力音声信号を制御することに寄与する。
Therefore, the
[第3の実施形態]
第3の実施形態について、詳細に説明する。
[Third Embodiment]
The third embodiment will be described in detail.
本実施形態は、ユーザが電子機器に近接しているか否かを考慮して、入力された音声信号をミュートする形態である。なお、本実施形態における説明では、上記の実施形態と重複する部分の説明は省略する。さらに、本実施形態における説明では、上記の実施形態と同一の構成要素には、同一の符号を付し、その説明を省略する。 In the present embodiment, an input audio signal is muted in consideration of whether or not the user is close to an electronic device. In the description of the present embodiment, the description of the same part as the above embodiment is omitted. Further, in the description of the present embodiment, the same components as those of the above-described embodiment are denoted by the same reference numerals, and the description thereof is omitted.
図5は、本実施形態に係る電子機器1aの内部構成の一例を示すブロック図である。図3に示す電子機器1と、図5に示す電子機器1aとの相違点は、図5に示す電子機器1aは近接センサ(物体検出部)60を含む点である。
FIG. 5 is a block diagram illustrating an example of an internal configuration of the electronic apparatus 1a according to the present embodiment. The
近接センサ60は、所定の範囲内の距離の物体を検出する。具体的には、近接センサ60は、電子機器1aと、所定の範囲内の距離の物体との距離を測定する。距離の測定方式は、赤外線を用いる方式、超音波を用いる方式等、各種あるが、その詳細は問わない。そして、近接センサ60は、距離の測定結果を含む出力信号を、符号化・複合部30に対して出力する。
The
また、電子機器1aは、所謂、ハンズフリー機能(オンフック機能とも呼ぶ)を備えていても良い。制御部20がハンズフリー機能を実行する場合、スピーカ13は、通信部40が受信した音声信号を出力しても良い。つまり、制御部20が、ハンズフリー機能(オンフック機能とも呼ぶ)を実行する場合、符号化・複合部30は、複合された音声信号を、スピーカアンプ50に対して出力しても良い。
The electronic device 1a may have a so-called hands-free function (also referred to as an on-hook function). When the control unit 20 executes the hands-free function, the speaker 13 may output an audio signal received by the communication unit 40. That is, when the control unit 20 executes a hands-free function (also referred to as an on-hook function), the encoding / combining
次に、本実施形態に係る電子機器1aの動作について説明する。 Next, the operation of the electronic device 1a according to this embodiment will be described.
図6は、本実施形態に係る電子機器1aが入力された音声信号をミュートする処理の一例を示すフローチャートである。 FIG. 6 is a flowchart illustrating an example of a process of muting the input audio signal by the electronic apparatus 1a according to the present embodiment.
ここで、相関値算出部22は、予め登録された第1の信号変化特徴量と、デジタル音声信号から抽出された第2の信号変化特徴量との相関値を算出した(図4に示すステップS7)とする。その場合、ステップS101において、予め登録された第1の信号変化特徴量と、デジタル音声信号から抽出された第2の信号変化特徴量との相関値が所定の閾値を超えるか否かを、出力音声制御部23は判断する。
Here, the correlation value calculation unit 22 calculates a correlation value between the first signal change feature value registered in advance and the second signal change feature value extracted from the digital audio signal (step shown in FIG. 4). S7). In this case, in step S101, whether or not the correlation value between the first signal change feature value registered in advance and the second signal change feature value extracted from the digital audio signal exceeds a predetermined threshold is output. The
第1の信号変化特徴量と、第2の信号変化特徴量との相関値が所定の閾値を超える場合(ステップS101のYes分岐)には、ステップS102に遷移する。一方、第1の信号変化特徴量と、第2の信号変化特徴量との相関値が所定の閾値を超えない場合(ステップS101のNo分岐)には、ステップS105に遷移する。 When the correlation value between the first signal change feature value and the second signal change feature value exceeds a predetermined threshold (Yes branch in step S101), the process proceeds to step S102. On the other hand, when the correlation value between the first signal change feature value and the second signal change feature value does not exceed the predetermined threshold (No branch in step S101), the process proceeds to step S105.
ステップS102において、ハンズフリー通話状態であるか否かを、制御部20は判断する。ハンズフリー通話状態である場合(ステップS102のYes分岐)には、ステップS105に遷移する。一方、ハンズフリー通話状態ではない場合(ステップS102のNo分岐)には、ステップS103に遷移する。 In step S102, the control unit 20 determines whether or not the hands-free call state is set. When it is a hands-free call state (Yes branch of step S102), the process proceeds to step S105. On the other hand, when it is not in the hands-free call state (No branch of step S102), the process proceeds to step S103.
ステップS103において、近接センサ60が稼動しているか否かを、制御部20は判断する。具体的には、近接センサ60が所定の範囲内の距離に物体を検出したか否かを、制御部20は判断する。
In step S103, the control unit 20 determines whether or not the
近接センサ60が稼動している場合(ステップS103のYes分岐)には、出力音声制御部23は、入力された音声信号をミュートする(ステップS104)。そして、図4に示すステップS2に戻り、処理を継続する。一方、近接センサ60が稼動していない場合(ステップS103のNo分岐)には、ステップS105に遷移する。
When the
ステップS105において、出力音声制御部23は、入力された音声信号をミュートせず、通話状態を維持する。そして、図4に示すステップS2に戻り、処理を継続する。
In step S105, the output
なお、制御部20は、通話開始時にハンズフリーで通話する設定であるか否かを確認しても良い。また、ミュート処理を実行中に、割り込み処理として、ハンズフリー処理が開始された場合、出力音声制御部23は、出力音声信号のミュート処理を解除するように制御しても良い。
Note that the control unit 20 may confirm whether or not it is set to make a hands-free call at the start of the call. Further, when the hands-free process is started as the interrupt process during the mute process, the output
以上のように、本実施形態に係る電子機器1aは、電子機器1aが稼動している場合、出力音声信号をミュートできる。例えば、周囲の環境によっては、入力音孔部が塞がれていない場合であっても、音声信号のエネルギー等が変化する恐れがある。しかし、本実施形態に係る電子機器1aは、ユーザが電子機器1aに近接しているか否かを判断する。そして、本実施形態に係る電子機器1aは、近接センサ60が稼動している場合には、入力された音声信号をミュートする。従って、本実施形態に係る電子機器1aは、より一層、ユーザの自然な所作に基づいて、適切に出力音声信号を制御することに寄与する。
As described above, the electronic device 1a according to the present embodiment can mute the output audio signal when the electronic device 1a is operating. For example, depending on the surrounding environment, even if the input sound hole is not blocked, the energy of the audio signal may change. However, the electronic device 1a according to the present embodiment determines whether or not the user is close to the electronic device 1a. And the electronic device 1a which concerns on this embodiment mutes the input audio | voice signal, when the
上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。 A part or all of the above embodiments can be described as in the following supplementary notes, but is not limited thereto.
(付記1)上記第1の視点に係る電子機器の通りである。 (Additional remark 1) It is as the electronic device which concerns on a said 1st viewpoint.
(付記2)前記出力音声制御部は、前記相関値が所定の閾値を超える場合、前記音声信号をミュートする付記1に記載の電子機器。
(Supplementary note 2) The electronic device according to
(付記3)所定の範囲内の距離の物体を検出する物体検出部をさらに備え、前記出力音声制御部は、前記物体検出部が前記物体を検出した場合であるとともに、前記相関値が前記所定の閾値を超える場合、前記音声信号をミュートする付記2に記載の電子機器。
(Additional remark 3) The object detection part which detects the object of the distance within the predetermined range is further provided, and the said output audio | voice control part is a case where the said object detection part detects the said object, and the said correlation value is the said predetermined value The electronic device according to
(付記4)前記出力音声制御部は、所定の時間で、所定の回数を超えて、前記相関値が前記所定の閾値を超える場合、前記音声信号をミュートする付記2又は3に記載の電子機器。
(Supplementary note 4) The electronic device according to
(付記5)前記音声入力部は入力音孔部を含み、前記音声入力部は、前記入力音孔部を介して、前記音声信号を入力し、前記特徴量抽出部は、前記入力音孔部が開放された音孔開放状態から、前記入力音孔部が塞がれた音孔閉塞状態に遷移した場合の前記音声信号に基づいて、前記第1の信号変化特徴量を抽出する付記1乃至4のいずれか一に記載の電子機器。
(Additional remark 5) The said audio | voice input part contains an input sound hole part, the said sound input part inputs the said audio | voice signal via the said input sound hole part, and the said feature-value extraction part is the said input sound hole part.
(付記6)前記特徴量抽出部は、前記音孔開放状態から前記音孔閉塞状態に遷移した場合の、所定の帯域の前記音声信号のエネルギーの変化量を、前記第1の信号変化特徴量として抽出する付記5に記載の電子機器。 (Additional remark 6) The said feature-value extraction part makes the said 1st signal change feature-value the amount of change of the energy of the said audio | voice signal of a predetermined | prescribed band at the time of changing from the said sound-hole open state to the said sound-hole obstruction | occlusion state. The electronic device according to appendix 5, which is extracted as
(付記7)前記特徴量抽出部は、所定の時間での前記音声信号のエネルギーの変化量を、前記第2の信号変化特徴量として抽出する付記1乃至6のいずれか一に記載の電子機器。
(Supplementary note 7) The electronic device according to any one of
(付記8)上記第2の視点に係る電子機器の制御方法の通りである。 (Additional remark 8) It is as the control method of the electronic device which concerns on the said 2nd viewpoint.
(付記9)前記出力音声制御工程において、前記相関値が所定の閾値を超える場合、前記音声信号をミュートする付記8に記載の電子機器の制御方法。 (Supplementary note 9) The electronic device control method according to supplementary note 8, wherein in the output audio control step, the audio signal is muted when the correlation value exceeds a predetermined threshold.
(付記10)所定の範囲内の距離の物体を検出する工程をさらに含み、前記出力音声制御工程において、所定の範囲内の距離の物体が検出された場合であるとともに、前記相関値が前記所定の閾値を超える場合、前記音声信号をミュートする付記9に記載の電子機器の制御方法。 (Additional remark 10) It further includes the process of detecting the object of the distance within a predetermined range, and when the object of the distance within a predetermined range is detected in the said output audio | voice control process, the said correlation value is the said predetermined value The control method of the electronic device according to appendix 9, wherein the audio signal is muted when the threshold value is exceeded.
(付記11)前記出力音声制御工程において、所定の時間で、所定の回数を超えて、前記相関値が前記所定の閾値を超える場合、前記音声信号をミュートする付記9又は10に記載の電子機器の制御方法。 (Supplementary note 11) The electronic device according to supplementary note 9 or 10, wherein, in the output audio control step, the audio signal is muted when the correlation value exceeds the predetermined threshold in a predetermined time exceeding a predetermined number of times. Control method.
(付記12)前記特徴量抽出工程において、所定の時間での前記音声信号のエネルギーの変化量を、前記第2の信号変化特徴量として抽出する付記8乃至11のいずれか一に記載の電子機器の制御方法。 (Supplementary note 12) The electronic device according to any one of supplementary notes 8 to 11, wherein, in the feature amount extraction step, a change amount of energy of the audio signal at a predetermined time is extracted as the second signal change feature amount. Control method.
(付記13)上記第3の視点に係るプログラムの通りである。 (Additional remark 13) It is as the program which concerns on the said 3rd viewpoint.
(付記14)前記出力音声制御処理において、前記相関値が所定の閾値を超える場合、前記音声信号をミュートする付記13に記載のプログラム。 (Additional remark 14) The program of Additional remark 13 which mutes the said audio | voice signal when the said correlation value exceeds a predetermined threshold value in the said output audio | voice control process.
(付記15)所定の範囲内の距離の物体を検出する処理をさらに実行し、前記出力音声制御処理において、所定の範囲内の距離の物体が検出された場合であるとともに、前記相関値が前記所定の閾値を超える場合、前記音声信号をミュートする付記14に記載のプログラム。
(Additional remark 15) The process which detects the object of the distance within a predetermined range is further performed, and when the object of the distance within the predetermined range is detected in the output audio control process, the correlation value is The program according to
(付記16)前記出力音声制御処理において、所定の時間で、所定の回数を超えて、前記相関値が前記所定の閾値を超える場合、前記音声信号をミュートする付記14又は15に記載のプログラム。
(Supplementary note 16) The program according to
(付記17)前記特徴量抽出処理において、所定の時間での前記音声信号のエネルギーの変化量を、前記第2の信号変化特徴量として抽出する付記14乃至16のいずれか一に記載のプログラム。
(Additional remark 17) The program as described in any one of
なお、引用した上記の特許文献の開示は、本書に引用をもって繰り込むものとする。本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の示要素(各請求項の各要素、各実施形態ないし実施例の各要素、各図面の各要素等を含む)の多様な組み合わせ、ないし、選択が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。特に、本書に記載した数値範囲については、当該範囲内に含まれる任意の数値ないし小範囲が、別段の記載のない場合でも具体的に記載されているものと解釈されるべきである。 The disclosure of the cited patent document is incorporated herein by reference. Within the scope of the entire disclosure (including claims) of the present invention, the embodiments and examples can be changed and adjusted based on the basic technical concept. In addition, various combinations of various indication elements (including each element of each claim, each element of each embodiment or example, each element of each drawing, etc.) within the scope of the claims of the present invention, Selection is possible. That is, the present invention of course includes various variations and modifications that could be made by those skilled in the art according to the entire disclosure including the claims and the technical idea. In particular, with respect to the numerical ranges described in this document, any numerical value or small range included in the range should be construed as being specifically described even if there is no specific description.
1、1a、100 電子機器
11 マイクロホン
12 レシーバ
13 スピーカ
14 操作部
15 表示部
16 マイクロホンアンプ
17 A/D変換器
18 記憶部
20 制御部
21、102 特徴量抽出部
22、103 相関値算出部
23、104 出力音声制御部
30 符号化・複合部
40 通信部
50 スピーカアンプ
60 近接センサ(物体検出部)
101 音声入力部
1, 1a, 100
101 Voice input part
Claims (9)
前記音声信号に基づいて、信号変化特徴量を抽出する特徴量抽出部と、
予め登録された第1の前記信号変化特徴量と、前記音声信号から抽出された第2の前記信号変化特徴量との相関値を算出する相関値算出部と、
前記相関値に基づいて、出力音声信号を制御する出力音声制御部と、
を備える電子機器。 An audio input unit for inputting an audio signal;
A feature quantity extraction unit that extracts a signal change feature quantity based on the audio signal;
A correlation value calculation unit for calculating a correlation value between the first signal change feature value registered in advance and the second signal change feature value extracted from the audio signal;
An output audio control unit that controls an output audio signal based on the correlation value;
Electronic equipment comprising.
前記出力音声制御部は、前記物体検出部が前記物体を検出した場合であるとともに、前記相関値が前記所定の閾値を超える場合、前記音声信号をミュートする請求項2に記載の電子機器。 An object detection unit for detecting an object at a distance within a predetermined range;
The electronic device according to claim 2, wherein the output audio control unit mutes the audio signal when the object detection unit detects the object and the correlation value exceeds the predetermined threshold.
前記音声入力部は、前記入力音孔部を介して、前記音声信号を入力し、
前記特徴量抽出部は、前記入力音孔部が開放された音孔開放状態から、前記入力音孔部が塞がれた音孔閉塞状態に遷移した場合の前記音声信号に基づいて、前記第1の信号変化特徴量を抽出する請求項1乃至4のいずれか一に記載の電子機器。 The voice input part includes an input sound hole part,
The audio input unit inputs the audio signal through the input sound hole unit,
The feature amount extraction unit is configured to change the first sound hole based on the sound signal when the sound hole is opened and the sound hole is closed. The electronic device according to claim 1, wherein one signal change feature amount is extracted.
前記音声信号に基づいて、信号変化特徴量を抽出する特徴量抽出工程と、
予め登録された第1の前記信号変化特徴量と、前記音声信号から抽出された第2の前記信号変化特徴量との相関値を算出する工程と、
前記相関値に基づいて、出力音声信号を制御する出力音声制御工程と、
を含む電子機器の制御方法。 Inputting an audio signal;
A feature amount extraction step of extracting a signal change feature amount based on the audio signal;
Calculating a correlation value between the first signal change feature value registered in advance and the second signal change feature value extracted from the audio signal;
An output sound control step of controlling an output sound signal based on the correlation value;
A method for controlling an electronic device.
音声信号を入力する処理と、
前記音声信号に基づいて、信号変化特徴量を抽出する特徴量抽出処理と、
予め登録された第1の前記信号変化特徴量と、前記音声信号から抽出された第2の前記信号変化特徴量との相関値を算出する処理と、
前記相関値に基づいて、出力音声信号を制御する出力音声制御処理と、
を実行するプログラム。 A program to be executed by a computer that controls an electronic device,
Processing to input audio signals;
A feature amount extraction process for extracting a signal change feature amount based on the audio signal;
Processing for calculating a correlation value between the first signal change feature value registered in advance and the second signal change feature value extracted from the audio signal;
An output sound control process for controlling an output sound signal based on the correlation value;
A program that executes.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013137949A JP2015012530A (en) | 2013-07-01 | 2013-07-01 | Electronic apparatus, control method therefor, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013137949A JP2015012530A (en) | 2013-07-01 | 2013-07-01 | Electronic apparatus, control method therefor, and program |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2015012530A true JP2015012530A (en) | 2015-01-19 |
Family
ID=52305297
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2013137949A Pending JP2015012530A (en) | 2013-07-01 | 2013-07-01 | Electronic apparatus, control method therefor, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2015012530A (en) |
-
2013
- 2013-07-01 JP JP2013137949A patent/JP2015012530A/en active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN106030700B (en) | determining operational instructions based at least in part on spatial audio properties | |
| US20080214160A1 (en) | Motion-controlled audio output | |
| KR101956577B1 (en) | Method for volume controlling an electronic device thereof | |
| CN107071119B (en) | A sound cancellation method and mobile terminal | |
| WO2019184398A1 (en) | Method for processing signals, terminal device, and non-transitory computer-readable storage medium | |
| JP2018517167A (en) | Method and apparatus for processing audio signals | |
| CN102647525A (en) | Mobile terminal and processing method on abnormal communication of mobile terminal | |
| CN106384597B (en) | Audio data processing method and device | |
| CN107371102B (en) | Audio playing volume control method and device, storage medium and mobile terminal | |
| US9119009B1 (en) | Transmitting audio control data to a hearing aid | |
| WO2015152937A1 (en) | Modifying sound output in personal communication device | |
| CN107369459A (en) | A kind of audio-frequency processing method and mobile terminal | |
| JP2007520943A (en) | Extended use of phones in noisy environments | |
| JP2010062663A (en) | Audio signal processing apparatus, audio signal processing method, and communication terminal | |
| CN106888327A (en) | Speech playing method and device | |
| US20080220820A1 (en) | Battery saving selective screen control | |
| US7764980B2 (en) | Mobile communication terminal for removing noise in transmitting signal and method thereof | |
| US9100821B2 (en) | Anti-eavesdropping communication system and method | |
| WO2018035868A1 (en) | Method for outputting audio, electronic device, and storage medium | |
| WO2014010272A1 (en) | Communication device, control method therefor, and program | |
| CN104769966A (en) | Receiver | |
| JP2015012530A (en) | Electronic apparatus, control method therefor, and program | |
| JP2014090350A (en) | Voice processing device, communication device, voice control method, and program | |
| JP5644610B2 (en) | Communication device and reception volume setting program | |
| CN106331356A (en) | A volume control method and terminal |