JP5790021B2 - Audio output system - Google Patents
Audio output system Download PDFInfo
- Publication number
- JP5790021B2 JP5790021B2 JP2011037362A JP2011037362A JP5790021B2 JP 5790021 B2 JP5790021 B2 JP 5790021B2 JP 2011037362 A JP2011037362 A JP 2011037362A JP 2011037362 A JP2011037362 A JP 2011037362A JP 5790021 B2 JP5790021 B2 JP 5790021B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- voice
- audio
- user
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000000873 masking effect Effects 0.000 claims description 15
- 230000005236 sound signal Effects 0.000 description 20
- 238000003860 storage Methods 0.000 description 16
- 238000000034 method Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 229940079593 drug Drugs 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 2
- 244000046052 Phaseolus vulgaris Species 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Landscapes
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Description
この発明は、マスカ音を出力するマスカ音出力装置と、音声端末装置と、からなる音声出力システムに関するものである。 The present invention relates to a voice output system including a masker sound output device that outputs a masker sound and a voice terminal device.
従来、同一空間内で複数の音声コンテンツを再生する場合に、それぞれの音声コンテンツの再生音が、相互に影響を及ぼしあうことを抑制するものが提案されている(例えば特許文献1を参照)。特許文献1の装置では、他のエリアでコンテンツが再生されていないときは音量を下げ、他のエリアでコンテンツが再生されると音量を上げるものである。
Conventionally, when a plurality of audio contents are reproduced in the same space, a technique has been proposed in which the reproduced sounds of the respective audio contents are prevented from affecting each other (see, for example, Patent Document 1). In the apparatus of
また、近年、銀行や調剤薬局等の対話カウンタにスピーカを取り付け、話者の音声と関連性の低い音声をマスカ音として出力することにより、順番を待つ他の人に話者の音声(会話内容)を聞き取り難くしたものが知られている。 In recent years, speakers have been attached to dialogue counters such as banks and dispensing pharmacies, and voices that are less relevant to the speaker's voice are output as masker sounds. ) Is known to be difficult to hear.
マスカ音は、音量が小さいとマスキング効果を得ることが難しくなる。したがって、マスカ音はある程度の音量で出力する必要があるが、マスカ音の音量が大きすぎると聞きたい音(例えば呼び出し音声)を聞くことができなくなってしまう。 Masking sound makes it difficult to obtain a masking effect when the volume is low. Therefore, it is necessary to output the masker sound at a certain volume, but if the volume of the masker sound is too high, it becomes impossible to hear the sound to be heard (for example, the calling voice).
そこで、本発明は、十分なマスキング効果を得ることができ、かつ聞きたい音を適切な音量で聞くことができる音声出力装置を提供することを目的とする。 Accordingly, an object of the present invention is to provide an audio output device that can obtain a sufficient masking effect and can listen to a sound to be heard at an appropriate volume.
この発明の音声出力システムは、マスカ音を出力するマスカ音出力装置と、ユーザによって携帯される端末装置と、を備えている。マスカ音出力装置は、前記ユーザに対してマスカ音を出力するように設置されている。そして、端末装置は、前記ユーザ毎に必要な音声を出力する。 The audio output system of the present invention includes a masker sound output device that outputs a masker sound and a terminal device carried by the user. The masker sound output device is installed so as to output a masker sound to the user. Then, the terminal device outputs a necessary voice for each user.
以上の構成により、聞きたい音声は、ユーザが携帯する端末装置(音声端末)からユーザの直近位置で出力されるため、マスキング効果を得るためにマスカ音の音量を大きくした場合であっても、ユーザが聞きたい音を適切な音量で聞くことができる。 With the above configuration, since the voice to be heard is output from the terminal device (voice terminal) carried by the user at the closest position of the user, even when the masker sound volume is increased to obtain a masking effect, The sound that the user wants to hear can be heard at an appropriate volume.
また、上記音声出力システムにおいて、音声端末がマスカ音を補助する音声を出力することで、よりマスキング効果を高めることも可能である。マスカ音を補助する音声としては、マスカ音出力装置が出力するマスカ音と同じものを出力する態様や、小川のせせらぎや木々のざわめきのような背景音や、断続的に発生する楽音のような演出性の高い音(演出音)等を出力する態様も可能である。 Moreover, in the said audio | voice output system, it is also possible to improve a masking effect more because an audio | voice terminal outputs the audio | voice which assists a masker sound. The sound that assists the masker sound is the same as the masker sound output by the masker sound output device, the background sound such as the stream of the brook or the noise of the trees, and the musical sound generated intermittently A mode of outputting a sound with high performance (production sound) or the like is also possible.
また、上記音声出力システムにおいて、音声端末から所定のコンテンツの音声を出力することも可能である。音声端末からコンテンツの音声を出力することで、ユーザの注意をマスク対象の音声からコンテンツの音声に向けさせることができ、よりマスキング効果を高めることができる。 In the audio output system, the audio of a predetermined content can be output from the audio terminal. By outputting the audio of the content from the audio terminal, the user's attention can be directed from the audio to be masked to the audio of the content, and the masking effect can be further enhanced.
なお、ユーザからコンテンツの選択を受け付ける受付手段を備え、ユーザが所望するコンテンツの音声を出力することで、さらにマスキング効果を高めることが望ましい。 Note that it is desirable to further improve the masking effect by providing reception means for accepting selection of content from the user and outputting audio of the content desired by the user.
実際には、銀行や調剤薬局等の待合場所に設けられた複数の表示装置に表示されるコンテンツの中から選択して対応する音声を出力することが望ましい。 Actually, it is desirable to select from contents displayed on a plurality of display devices provided at a waiting place such as a bank or a dispensing pharmacy and output a corresponding sound.
また、上記マスカ音を補助する音声は、ユーザからコンテンツの選択を受け付けなかった場合に出力することが望ましい。 Further, it is desirable that the voice assisting the masker sound is output when selection of content is not accepted from the user.
この発明によれば、十分なマスキング効果を得ることができ、かつユーザが聞きたい音を適切な音量で聞くことができる。 According to the present invention, a sufficient masking effect can be obtained, and the sound that the user wants to hear can be heard at an appropriate volume.
図1は、音声出力システムの概要を示す配置図である。音声出力システムは、例えば銀行や調剤薬局等の対話カウンタおよび待合場所に設置される。対話カウンタの近傍にはマスカ音を出力するマスカ音出力装置3が設置され、待合場所に向けてマスカ音が放音される。このマスカ音は、対話カウンタ内で会話を行う者の発言内容をマスクし、待合場所に居る者に発言内容を理解できないようにするものである。
FIG. 1 is a layout diagram showing an outline of an audio output system. The voice output system is installed in a dialogue counter and a waiting place such as a bank or a dispensing pharmacy. A masker
図1においては、3つの対話カウンタにそれぞれユーザ90およびスタッフ91が存在し、対話カウンタから離れた待合場所に複数のユーザ92が存在する。スタッフ91は、例えば薬の説明を行う薬剤師であり、ユーザ90は薬の説明を聞く患者であり、ユーザ92は順番待ちの患者である。
In FIG. 1, there are a
各ユーザ92は、受付場所のスタッフ93から音声端末1を受け取り、携帯する。この音声端末1には、スピーカが設けられており、順番が来たときに呼び出し音声(合成音声やスタッフの実音声、あるいはビープ音等)が出力される。ユーザ92は、呼び出し音声を聞くことで順番が来たことを知ることができる。順番が来たユーザ92は、音声端末1を携帯して対話カウンタに向かい、対話カウンタ内でスタッフ91に音声端末1を返却する。このようにして、音声端末1は、無線呼び出し(いわゆるページャ)の機能を有する。このように、ユーザが携帯する音声端末1から呼び出し音声を出力することで、マスカ音出力装置3が、マスキング効果を得るためにマスカ音をある程度の音量で出力したとしても、ユーザ毎に必要な音声(本実施形態では呼び出し音声)を適切な音量で聞くことができる。
Each
また、本実施形態の音声出力システムでは、待合場所に表示装置7が設けられている。表示装置7は、一般的に待合場所に設けられた汎用情報表示用ディスプレイであり、所定のコンテンツの映像が表示されている。この例では、3つの表示装置7が設置され、それぞれ豆知識チャンネル、健康チャンネル、宣伝広告チャンネル等、チャンネル毎に個別のコンテンツ映像が表示されている。音声端末1は、これらコンテンツの音声も出力する。音声出力の対象となるコンテンツは、ユーザが音声端末1を操作して、手動で選択することができるようになっている。ユーザ92は、音声端末1から出力されるコンテンツの音声を聞くことで、自身の注意がマスク対象の音声(対話カウンタ内の会話)ではなく、コンテンツの音声に向くことになり、よりマスキング効果を高めることができる。
In the audio output system of the present embodiment, the display device 7 is provided at the waiting place. The display device 7 is a general-purpose information display generally provided at a waiting place, and displays a video of predetermined content. In this example, three display devices 7 are installed, and individual content images are displayed for each channel, such as a bean knowledge channel, a health channel, and an advertisement channel. The
以下、上記の音声出力システムを実現するための具体的な構成、動作について説明する。図2(A)は、音声端末1の構成を示すブロック図であり、図2(B)は、音声端末1の外観図である。図3は、マスカ音出力装置3の構成を示すブロック図であり、図4は、サーバ5の構成を示すブロック図である。図5は、サーバ5とマスカ音出力装置3の動作を示すフローチャートである。図6および図7は、サーバ5と音声端末1の動作を示すフローチャートである。
Hereinafter, a specific configuration and operation for realizing the audio output system will be described. FIG. 2A is a block diagram showing a configuration of the
音声端末1は、マイク11、A/Dコンバータ12、信号処理部13、D/Aコンバータ14、スピーカ15、制御部16、通信部17、および操作部18を備えている。
The
マスカ音出力装置3は、通信部31、制御部32、信号処理部33、D/Aコンバータ34、およびスピーカ35を備えている。
The masker
サーバ5は、通信部51、制御部52、マスカ音生成部53、マスカ音記憶部54、コンテンツ記憶部55、および出力インタフェース(I/F)56を備えている。
The
マスカ音出力装置3は、通信部31を介してサーバ5の通信部51と接続され、サーバ5から種々のデータを送受信する。ここでは、主にサーバ5からマスカ音に係る音データを受信する。
The masker
サーバ5の制御部52は、マスカ音生成部53にマスカ音の生成を指示し、マスカ音生成部53が生成したマスカ音に係る音データを通信部51を介してマスカ音出力装置3に出力する。
The
マスカ音生成部53は、マスカ音記憶部54に記憶されている各種音データを読み出してマスカ音に係る音データを生成し、制御部52に出力する。マスカ音は、音声をマスクすることが可能な音であればどの様な音であってもよいが、例えば、マスカ音記憶部54に記憶されている撹乱音、背景音、および演出音を組み合わせて生成する。
The masker
撹乱音は、マスク対象の音声を撹乱する音であり、人の音声を時間軸上あるいは周波数軸上で改変し、語彙的に何ら意味をなさない(内容が理解できない)ようにしたものである。撹乱音が人の音声を時間軸上で改変したものである場合、予め特定の話者の音声(男性および女性を含む複数人の音声)を録音し、所定時間毎に一定長の区間に分割した音声信号を各区間で逆方向に読み出す等して、語彙的に意味をなさない音声に変更する。周波数軸上で改変する場合、スペクトル包絡のピーク(フォルマント)を抽出し、語彙に影響する特定のフォルマントを変更して語彙的に意味をなさない音声に変更する。 Disturbing sound is a sound that disturbs the voice to be masked, and it is a human voice that is modified on the time axis or frequency axis so that it does not make any meaning in the vocabulary (the contents cannot be understood). . If the disturbing sound is a modified human voice on the time axis, the voice of a specific speaker (multiple voices including males and females) is recorded in advance and divided into sections of a certain length every predetermined time The voice signal is read out in the opposite direction in each section, and the voice is changed to a voice that does not make sense lexically. When modifying on the frequency axis, the peak (formant) of the spectral envelope is extracted, and a specific formant that affects the vocabulary is changed to change to a vocabulary meaningless voice.
なお、撹乱音は、音声端末1のマイクを用いて、対話カウンタ内の話者の音声を取得して、取得した音声を改変することにより、都度、生成する態様としてもよい。
Note that the disturbing sound may be generated each time by acquiring the voice of the speaker in the dialogue counter using the microphone of the
背景音は、例えば小川のせせらぎや木々のざわめき等、聴取者が聴覚的に注目し難く、不快感のない音である。これにより、暗騒音レベルを上げ、撹乱音の違和感を目立たなくする。 The background sound is a sound with no uncomfortable feeling that is difficult for the listener to notice audibly, such as a stream of a stream or a buzz of trees. As a result, the background noise level is raised and the uncomfortable feeling of the disturbing sound is made inconspicuous.
演出音は、断続的に発生する楽音等の演出性の高い音である。これにより、聴取者の注意を演出音にも向けさせ、聴覚心理的に撹乱音の違和感を目立たなくする。これらの撹乱音、背景音、および演出音を組み合わせたマスカ音をユーザ92に聴取させることで、話者の音声をマスクしつつ、不快感を低減することが可能となる。
The production sound is a high performance sound such as a musical sound generated intermittently. As a result, the listener's attention is also directed to the production sound, and the sense of incongruity of the disturbing sound is made inconspicuous psychologically. By causing the
なお、マスカ音記憶部54に記憶されている撹乱音、背景音、および演出音に係る音データは、それぞれ1つに限らず、複数の音データであってもよい。この場合、マスカ音生成部53は、複数の音データから特定の音データを選択して読み出す。複数の音データが記憶されている場合、予め規定された組み合わせテーブル(マスカ音記憶部54に記憶されたテーブル)に従って選択する態様としてもよい。また、テーブルには、各音の音量や読み出しタイミング等を記載しておき、各音の音量や読み出しタイミングを個別に変更する態様としてもよい。また、各音データを予め合成済みのマスカ音として記憶しておき、再生するように構成することも可能である。
Note that the sound data related to the disturbing sound, the background sound, and the effect sound stored in the masker
サーバ5は、このようなマスカ音に係る音データを生成し、マスカ音出力装置3に送信する。マスカ音出力装置3の制御部32は、通信部31を介してマスカ音に係る音データを受信し、再生処理を行う。例えば、マスカ音に係る音データがエンコードされた圧縮データであればデコードし、デジタル音声信号に変換し、信号処理部33に出力する。信号処理部33は、入力されたデジタル音声信号の音量や周波数特性等を調整し、D/Aコンバータ34に出力する。信号処理部33から出力されたデジタル音声信号は、D/Aコンバータ34でアナログ音声信号に変換され、スピーカ35から放音される。このようにして、待合場所に居るユーザ92にマスカ音が出力される。
The
次に、サーバ5と音声端末1の機能、動作について説明する。音声端末1は、通信部17を介してサーバ5の通信部51と接続され、サーバ5から種々のデータを送受信する。ここでは、主に呼び出し音声に係る音データや、コンテンツの音データをサーバ5から受信する。
Next, functions and operations of the
サーバ5の制御部52は、コンテンツ記憶部55からコンテンツに係る音データおよび映像データを読み出し、コンテンツに係る音データを通信部51を介して音声端末1に送信する。また、制御部52は、コンテンツに係る映像データを出力I/F56を介して各表示装置7に出力する。コンテンツに係る音データおよび映像データは、複数種類記憶されており、同時に表示装置の数だけ(本実施形態では3つ)読み出しされる。
The
なお、音データについては、同時に複数読み出してブロードキャストで全音声端末1に送信するようにしてもよいが、音声端末1から要求がなされたコンテンツに係る音データを読み出し、ユニキャストで送信してもよい。例えば、本実施形態では、図1に示すように、3つの表示装置7にそれぞれch.1(豆知識チャンネル)、ch.2(健康チャンネル)、ch.3(宣伝広告チャンネル)のコンテンツ映像が表示されている。そのため、ユーザは、音声端末1の操作部18のうち、図2(B)に示すように、「1」、「2」、「3」と表示されたボタンを押下する。例えばユーザが「1」と表示されたボタンを押下すると、制御部16は、ch.1のコンテンツの音データの配信要求を行う。すると、サーバ5の制御部52は、ch.1のコンテンツの音データを要求がなされた音声端末1に送信する。
Note that a plurality of sound data may be simultaneously read out and transmitted to all the
サーバ5は、このようにして、コンテンツに係る音データを音声端末1に送信する。音声端末1の制御部16は、通信部17を介してコンテンツに係る音データを受信し、再生処理を行う。例えば、音データがエンコードされた圧縮データであればデコードし、デジタル音声信号に変換し、信号処理部13に出力する。また、サーバ5から複数の音データが同時に送信された場合、操作部18のうち、押下されたボタンに対応するチャンネルのデジタル音声信号のみ信号処理部13に出力する。
In this way, the
信号処理部13は、入力されたデジタル音声信号の音量や周波数特性等を調整し、D/Aコンバータ14に出力する。信号処理部13から出力されたデジタル音声信号は、D/Aコンバータ14でアナログ音声信号に変換され、スピーカ15から放音される。このようにして、待合場所に居る各ユーザ92にコンテンツの音声が出力される。なお、コンテンツの音声は、スピーカではなく、ヘッドフォンを介して各ユーザ92が聞くようにしてもよい。
The
なお、図2(B)に示すように、音声端末1は、「1」、「2」、「3」と表示されたボタン意外にも「OFF」と表示されたボタンを備えている。ユーザが「OFF」と表示されたボタンを押下すると、制御部16は、音データの再生処理を停止する、あるいは、サーバ5に音データの配信を停止する要求を行う。これにより、コンテンツの音声を出力しないように設定することもできる。なお、このとき、コンテンツの音声に代えて、マスカ音を補助する音声を出力するようにしてもよい。マスカ音を補助する音声としては、マスカ音出力装置3が出力するマスカ音と同じものを出力する態様や、その一部(背景音だけ、演出音だけ、撹乱音+背景音、撹乱音+演出音、背景音+演出音、等)を出力する態様も可能である。いずれにしても、ユーザが「OFF」と表示されたボタンを押下すると、制御部16は、補助音声の配信要求を行う。すると、サーバ5の制御部52は、マスカ音を補助する音声(マスカ音出力装置3に出力しているマスカ音や、その一部)を要求がなされた音声端末1に送信する。これにより、マスカ音を補助する音声がユーザの直近で出力されるため、仮にマスカ音出力装置3から出力されるマスカ音の音量が低くとも、十分なマスキング効果を得ることができる。
As shown in FIG. 2B, the
また、本実施形態に示す音声端末1は、マイク11を備えており、対話カウンタ内におけるスタッフ91およびユーザ90の発話音声を収音することができるようになっている。マイク11は、収音した音声に係るアナログ音声信号をA/Dコンバータ12に出力する。A/Dコンバータ12は、入力されたアナログ音声信号をデジタル音声信号に変更し、制御部16に出力する。制御部16は、入力されたデジタル音声信号をそのまま、あるいはMP3等の圧縮データにエンコードし、通信部17を介してサーバ5に送信する。
In addition, the
サーバ5に送信された対話カウンタ内の会話音声に係る音データは、制御部52を介してコンテンツ記憶部55に録音データとして蓄積される。このサーバ5に送信された音データは、マスカ音生成部53において、撹乱音の生成に用いられる。あるいは、ユーザが自宅のPC等を用いてインターネットを経由して録音データを読み出し、会話内容(例えば薬の説明)を再度聞き直すこともできる。
The sound data related to the conversation voice in the conversation counter transmitted to the
図5(A)は、音声端末1で収音された音声信号に係る音データをサーバ5に送信し、サーバ5がマスカ音を生成する場合のサーバ5、音声端末1、およびマスカ音出力装置3の動作を示したフローチャートである。まず、音声端末1の制御部16は、所定レベル(ノイズと区別できる程度のレベル)以上の音声信号が入力され、マイク11で音声を収音したか否かを判断する(s1)。制御部16は、音声を収音していると判断した場合(s1,Yes)、入力した音声信号をそのまま、あるいはMP3等の圧縮データにエンコードし、サーバ5に送信する(s2)。サーバ5の制御部52は、音声端末1から送信された音声信号(音データ)を受信し(s3)、録音データとしてコンテンツ記憶部55に記憶する(s4)。
FIG. 5 (A) shows the
なお、複数の音声端末1から音声信号(音データ)を受信する場合、それぞれの録音データを区別できるようにコンテンツ記憶部55に記憶しておくことが好ましい。例えば、各ユーザ92が受付場所のスタッフ93から音声端末1を受け取るとき、ユーザ毎に固有の識別情報(ID)を発行する。各ユーザ92が呼び出しを受けて対話カウンタ内に行くと、対話カウンタ内のスタッフ91は、このスタッフ91の付近に設置された専用の端末(不図示)を操作して各ユーザの識別情報、およびそのユーザが使用している音声端末1の識別情報(製造番号等)をサーバ5に送信する。あるいは、ユーザ92から受け取った音声端末1を操作して、各ユーザの識別情報の送信を行う。そして、音声端末1は、上記s3の処理において、自身の識別情報(製造番号等)を音声信号とともに送信する。サーバ5は、受信した音声信号、ユーザの識別情報、および音声端末1の識別情報を対応づけてコンテンツ記憶部55に記憶する。これにより、後述(図5(B))の録音データの再生動作において、各ユーザが再生する録音データを識別することができる。なお、後述(図5(B))の録音データの再生動作を実行しない場合、音声端末1から受信した音声信号は、マスカ音生成のために一時的に保持するだけでよく、コンテンツ記憶部55に録音データとして蓄積する必要はない。
When receiving audio signals (sound data) from a plurality of
次に、制御部52は、マスカ音(撹乱音)を生成する処理を行う(s5)。ここで、撹乱音は、現在会話が行われている対話カウンタ内で収音された音声信号から生成することが好ましい。すなわち、現時点で音声端末1から受信している音声信号を、時間軸上あるいは周波数軸上で改変し、撹乱音を生成する処理を行う。生成した撹乱音は、コンテンツ記憶部53に記憶されている他の音データ(背景音や効果音)と合成してマスカ音とする。無論、コンテンツ記憶部55に記憶されている録音データのうち、最新の録音データを読み出して撹乱音を生成するようにしてもよい。また、複数の音声端末1から音声信号(話者の音声)を受信した場合、これら複数の音声信号を合成(ミキシング)した後に時間軸上あるいは周波数軸上で改変し、撹乱音を生成することが好ましい。
Next, the
その後、制御部52は、生成したマスカ音をマスカ音出力装置3に出力する(s6)。マスカ音出力装置3は、サーバ5が送信したマスカ音を受信し(s7)、再生処理を行う(s8)。以上のようにして対話カウンタ内の会話音声に応じた最適な撹乱音を生成することができる。
Thereafter, the
次に、図5(B)は、会話内容の記録をする場合のサーバ5、および他の情報処理装置(例えば自宅PC)の動作を示したフローチャートである。同図に示す自宅PCの動作は、当該自宅PCにインストールされたアプリケーションや、WEBブラウザ上の特定のスクリプト等によって実現される。自宅PCのハードウェア構成は、一般的なパーソナルコンピュータと同様であるため、図示および説明を省略する。
Next, FIG. 5B is a flowchart showing operations of the
まず、自宅PCは、各ユーザが自宅PCを操作して、録音データの再生指示を行ったか否かを判断する(s71)。例えば、各ユーザが上記アプリケーションを操作して、固有の識別情報(ID)を入力したか否かを判断する。IDが入力されて録音データの再生指示が行われた場合(s71、Yes)、自宅PCは、インターネットを経由して、入力されたIDをサーバ5に送信する(s72)。サーバ5は、自宅PCからIDを受信し(s73)、コンテンツ記憶部55に記憶されている録音データのうち、受信したIDに対応づけられている録音データを読み出す(s74)。そして、読み出した録音データを自宅PCに送信する(s75)。自宅PCは、送信された録音データを受信し(s76)、再生処理を行う(s77)。なお、各IDに対応づけられている録音データが複数蓄積されている場合、サーバ5は、s73の処理の後に、録音データのリスト(録音日時等の一覧情報)を自宅PCに送信し、どの録音データを再生するのかを受け付ける処理を行う。ユーザが自宅PCを操作して、受信したリストから再生したい録音データを選択すると、選択した録音データがサーバ5から自宅PCに送信される。
First, the home PC determines whether or not each user operates the home PC to give an instruction to reproduce recorded data (s71). For example, it is determined whether each user operates the application and inputs unique identification information (ID). When the ID is input and the reproduction instruction of the recorded data is performed (s71, Yes), the home PC transmits the input ID to the
このようにして、音声端末1を用いて録音した会話内容は、録音データとしてサーバ5に蓄積しておくことにより、ユーザやユーザの家族等が、自宅PCを用いて会話内容を再生させることが可能となり、薬の説明や注意事項等を再確認することができる。
Thus, the conversation content recorded using the
次に、図6および図7のフローチャートを参照して、ユーザが銀行や薬局等で受付を行って音声端末1を受け取った場合のサーバ5と音声端末1の動作を詳細に説明する。図6および図7に示す動作は、音声端末1の電源が投入されると開始される。例えば、ユーザが受付カウンタで音声端末を受け取るときに、スタッフ93が音声端末1の電源を投入するため、これらの動作が開始される。また、ユーザが操作部18の各ボタンを押下したときにもこれらの動作が開始される。
Next, the operations of the
まず、図6において、音声端末1の制御部16は、ユーザが操作部18の各種チャンネルボタンを押下し、チャンネル指定がなされているか否かを確認する(s11)。制御部16は、チャンネル指定がなされていれば(s11、Yes)、サーバ5に該当チャンネルの音データの配信要求を行う(s12)。サーバ5の制御部52は、配信要求を受信すると(s13)、要求されているチャンネルのコンテンツの音データを、要求がなされた音声端末1に送信する(s14)。そして、音声端末1は、送信されたコンテンツの音データを受信し(s15)、再生処理を行う(s16)。
First, in FIG. 6, the
一方、制御部16は、チャンネル指定がなされていない(s11、No)、すなわち「OFF」のボタンが押下されていた場合や、電源投入直後である場合、マスカ音を補助する音声の配信要求を行う(s17)。サーバ5の制御部52は、配信要求を受信すると(s18)、マスカ音を補助する音声(例えばマスカ音出力装置3に送信しているマスカ音の音データとおなじもの)を、要求がなされた音声端末1に送信する(s19)。そして、音声端末1は、送信されたマスカ音を補助する音声(音データ)を受信し(s20)、再生処理を行う(s21)。
On the other hand, when the channel is not designated (s11, No), that is, when the “OFF” button is pressed or immediately after the power is turned on, the
なお、図6の例では、チャンネル指定がなされていないとき、および電源投入直後である場合にマスカ音を補助する音声を出力する例を示したが、電源投入後から最初にチャンネル指定が行われるまでは、所定のコンテンツ(例えば宣伝広告チャンネル)の音声を出力する態様としてもよい。 In the example of FIG. 6, an example of outputting a voice assisting a masker sound when channel designation is not made and immediately after power-on is shown, but channel designation is performed first after power-on. Up to the above, it is possible to output sound of predetermined content (for example, an advertising channel).
次に、図7において、サーバ5の制御部52は、呼び出し端末の指定がなされたか否かを判断する(s31)。この呼び出し端末の指定は、例えば対話カウンタ内のスタッフ91の付近に設置された専用の端末(不図示)を操作することで行われる。このとき、呼び出し対象ユーザの指定も行われる。あるいは、対話カウンタ内のスタッフ91がユーザ90から音声端末1の返却を受け、説明が終了してユーザ90が退席したのちに、この返却を受けた音声端末1を操作して、呼び出し対象を指定する態様としてもよい。スタッフ91が呼び出し操作を行うと、専用の端末(あるいは音声端末1)からサーバ5に呼び出し信号が送信され、s31の判断においてYesに進むことになる。
Next, in FIG. 7, the
制御部52は、呼び出し対象の音声端末1に対して呼び出し音声に係る音データを送信する(s32)。そして、呼び出し対象の音声端末1は、呼び出し音声に係る音データを受信し(s33)、呼び出し音声を再生する(s34)。
The
以上の様にして、本実施形態の音声出力システムでは、マスカ音出力装置3からある程度の音量でマスカ音を出力し、マスキング効果を確保しながら、ユーザが携帯する音声端末1から呼び出し音声を出力して必要な音声を適切な音量で聞くことができる。
As described above, in the voice output system of the present embodiment, the masker sound is output from the masker
なお、本実施形態では、サーバ5からマスカ音出力装置3にマスカ音に係る音データをダウンロード(あるいはストリーミング)する例を示したが、マスカ音出力装置3内に記憶部を設け、内部の記憶部からマスカ音に係る音データを読み出す態様も可能である。また、この場合、マスカ音出力装置3には、通信機能が不要になる。
In the present embodiment, an example in which sound data related to masker sound is downloaded (or streamed) from the
また、音声端末1は、本実施形態に示した音声出力システムに専用の装置でなくとも、一般的な携帯電話等の携帯端末およびソフトウェアを用いて実現することが可能である。
Further, the
また、マスカ音出力装置3やサーバ5についても、本実施形態に示した音声出力システムに専用の装置でなくとも、一般的なパーソナルコンピュータ等の情報処理装置のハードウェアおよびソフトウェアを用いて実現可能である。
Further, the masker
また、本実施形態では、表示装置7に表示されるコンテンツに関する音声が音声端末
から出力される例を示したが、表示装置7がなくとも、所定のコンテンツ(例えば音楽等)を出力することも可能である。
Further, in the present embodiment, an example in which audio related to content displayed on the display device 7 is output from the audio terminal is shown, but predetermined content (for example, music or the like) may be output without the display device 7. Is possible.
1…音声端末
3…マスカ音出力装置
5…サーバ
7…表示装置
11…マイク
12…A/Dコンバータ
13…信号処理部
14…D/Aコンバータ
15…スピーカ
16…制御部
17…通信部
18…操作部
31…通信部
32…制御部
33…信号処理部
34…D/Aコンバータ
35…スピーカ
DESCRIPTION OF
Claims (6)
ユーザによって携帯される端末装置と、
を備えた音声出力システムであって、
前記マスカ音出力装置は、前記ユーザに対してマスカ音を出力するように設置され、
前記端末装置は、前記ユーザ毎に必要な音声を出力する音声出力手段を備え、
前記端末装置の音声出力手段は、前記マスカ音を補助する音声を出力することを特徴とする音声出力システム。 A masker sound output device that outputs a masker sound;
A terminal device carried by the user;
An audio output system comprising:
The masker sound output device is installed to output a masker sound to the user,
The terminal device includes voice output means for outputting a voice required for each user ,
The sound output unit of the terminal device outputs a sound assisting the masker sound .
ユーザによって携帯される端末装置と、 A terminal device carried by the user;
を備えた音声出力システムであって、 An audio output system comprising:
前記マスカ音出力装置は、前記ユーザに対してマスカ音を出力するように設置され、 The masker sound output device is installed to output a masker sound to the user,
前記端末装置は、前記ユーザ毎に必要な音声を出力する音声出力手段を備え、 The terminal device includes voice output means for outputting a voice required for each user,
前記端末装置の音声出力手段は、所定のコンテンツの音声を出力することを特徴とする音声出力システム。 An audio output system, wherein the audio output means of the terminal device outputs audio of a predetermined content.
前記音声出力手段は、前記受付手段で選択されたコンテンツの音声を出力することを特徴とする請求項2または3に記載の音声出力システム。 The terminal device includes a receiving unit that receives selection of the content from a user,
The audio output system according to claim 2 or 3, wherein the audio output means outputs the audio of the content selected by the accepting means.
前記音声出力手段は、前記受付手段でコンテンツの選択を受け付けなかった場合に、前記マスカ音を補助する音声を出力する請求項1または請求項2に記載の音声出力システム。 The terminal apparatus includes a reception means for receiving a selection of a user or Rako content,
It said voice output means, when said not received the selection of content by accepting means, audio output system according to claim 1 or claim 2 outputs audio to assist the masking sound.
前記音声出力手段は、前記表示装置に表示される映像に対応するコンテンツの音声を出力することを特徴とする請求項1乃至請求項5のいずれかに記載の音声出力システム。 It further comprises a display device for displaying content video,
It said voice output means, audio output system according to any one of claims 1 to 5, characterized in that outputs audio of the content corresponding to the image displayed on the display device.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011037362A JP5790021B2 (en) | 2011-02-23 | 2011-02-23 | Audio output system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011037362A JP5790021B2 (en) | 2011-02-23 | 2011-02-23 | Audio output system |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2012173630A JP2012173630A (en) | 2012-09-10 |
| JP5790021B2 true JP5790021B2 (en) | 2015-10-07 |
Family
ID=46976551
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2011037362A Expired - Fee Related JP5790021B2 (en) | 2011-02-23 | 2011-02-23 | Audio output system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5790021B2 (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014130251A (en) * | 2012-12-28 | 2014-07-10 | Glory Ltd | Conversation protection system and conversation protection method |
| US9407738B2 (en) * | 2014-04-14 | 2016-08-02 | Bose Corporation | Providing isolation from distractions |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH046918A (en) * | 1990-04-24 | 1992-01-10 | Toppan Printing Co Ltd | remote pager system |
| JP2992608B2 (en) * | 1994-03-18 | 1999-12-20 | 鹿島建設株式会社 | Masking broadcasting equipment |
| JP2003044684A (en) * | 2001-07-26 | 2003-02-14 | Sony Corp | Order management system and method |
| JP4336552B2 (en) * | 2003-09-11 | 2009-09-30 | グローリー株式会社 | Masking device |
| JP2006067084A (en) * | 2004-08-25 | 2006-03-09 | Nec Corp | Foldable type portable terminal equipment |
| JP4640801B2 (en) * | 2005-06-27 | 2011-03-02 | 富士通株式会社 | Telephone |
| JP4306708B2 (en) * | 2006-09-25 | 2009-08-05 | ヤマハ株式会社 | Audio signal processing device |
| JP5417821B2 (en) * | 2008-11-28 | 2014-02-19 | ソニー株式会社 | Audio signal playback device, mobile phone terminal |
-
2011
- 2011-02-23 JP JP2011037362A patent/JP5790021B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2012173630A (en) | 2012-09-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5966326B2 (en) | Masker sound output device, masker sound output system, and program | |
| US20080037718A1 (en) | Methods and apparatus for delivering ancillary information to the user of a portable audio device | |
| KR20100058585A (en) | Technique for allowing the modification of the audio characteristics of items appearing in an interactive video using rfid tags | |
| JP5790021B2 (en) | Audio output system | |
| WO2014141413A1 (en) | Information processing device, output method, and program | |
| JP2014130251A (en) | Conversation protection system and conversation protection method | |
| JP2023025013A (en) | Singing support device for music therapy | |
| JP7800450B2 (en) | Information processing device, information processing method, and program | |
| KR101869508B1 (en) | Apparatus for providing lullaby | |
| JP5925493B2 (en) | Conversation protection system and conversation protection method | |
| JP5747490B2 (en) | Masker sound generation device, masker sound output device, and masker sound generation program | |
| JP2012194295A (en) | Speech output system | |
| WO2020080204A1 (en) | Acoustic content generating device, acoustic content generating method, acoustic content playback device, acoustic content playback method, program for playing back acoustic content, acoustic content providing device, and acoustic content delivery system | |
| JP6300328B2 (en) | ENVIRONMENTAL SOUND GENERATION DEVICE, ENVIRONMENTAL SOUND GENERATION SYSTEM, ENVIRONMENTAL SOUND GENERATION PROGRAM, SOUND ENVIRONMENT FORMING METHOD, AND RECORDING MEDIUM | |
| JP2006140595A (en) | Information conversion apparatus, information conversion method, communication apparatus, and communication method | |
| JP7359896B1 (en) | Sound processing equipment and karaoke system | |
| JP2010176041A (en) | Singing sound recording and reproducing system | |
| JP2010176042A (en) | Singing sound recording karaoke system | |
| Coughlan-Allen | Unknown Pleasure: interpretations of the mystery hiss in Feist's 2017 album | |
| Chen | Beyond Words: Navigating Aural Fantasies in Chinese Boys’ Love Audio Drama | |
| CN115398534A (en) | Play control method, control system, and program | |
| JP2021156954A (en) | Karaoke device | |
| JP7704195B2 (en) | Live streaming device, live streaming method, and program | |
| EP4550310A1 (en) | Signal processing device, congnitive function improvement system, signal processing method, and program | |
| JP7593018B2 (en) | Playback control method, control system, and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131219 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141121 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141202 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150130 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150707 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150720 |
|
| LAPS | Cancellation because of no payment of annual fees |